Андреас Вайгенд - BIG DATA. Вся технология в одной книге

Тут можно читать онлайн Андреас Вайгенд - BIG DATA. Вся технология в одной книге - бесплатно ознакомительный отрывок. Жанр: comp-db, издательство Литагент 5 редакция, год 2018. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    BIG DATA. Вся технология в одной книге
  • Автор:
  • Жанр:
  • Издательство:
    Литагент 5 редакция
  • Год:
    2018
  • ISBN:
    978-5-04-094117-9
  • Рейтинг:
    4/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Андреас Вайгенд - BIG DATA. Вся технология в одной книге краткое содержание

BIG DATA. Вся технология в одной книге - описание и краткое содержание, автор Андреас Вайгенд, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Информация как таковая становится самой значительной отраслью экономики, и базы данных знают о каждом конкретном человеке больше, чем известно ему самому. Чем больше информации о каждом из нас попадает в базы данных, тем в меньшей степени мы существуем.

BIG DATA. Вся технология в одной книге - читать онлайн бесплатно ознакомительный отрывок

BIG DATA. Вся технология в одной книге - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Андреас Вайгенд
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

В ряде случаев мотив уточняющего редактирования понятен и безобиден. Например, после нескольких знакомств человек может решить уточнить раздел своих интересов, поняв, что излишне напирает на свое мастерство скалолаза и не договаривает о том, как ему нравится ходить на концерты. Аналогичным образом он может скорректировать описание объекта поиска. Исправления же более кардинальные, например частые смены статуса с «одинокого» на «состоящего в отношениях», могут вызвать неодобрение.

Вообразим себе сценарий, при котором пользователи получают возможность видеть не только историю редактирования профайла, но и историю общения на сайте. Обычная проблема приложений знакомств для людей традиционной ориентации в том, что женщин часто засыпают сотнями сообщений, в то время как некоторые мужчины вообще не получают их. Чтобы стимулировать более симметричную коммуникацию, в приложениях знакомств попробовали ограничить число сообщений, которые один человек может направить за определенный период времени. Но поскольку аудитория этих приложений ежедневно меняется (пользователи выбывают и прибывают), это верный способ вызвать ее недовольство. А вдруг девушка вашей мечты активирует свой профайл на следующий день после того, как вы исчерпали свой месячный лимит, а к моменту его возобновления снова исчезнет? Вы же не знаете причины, по которым алгоритм не показывает ее вам, – то ли потому, что вы не отреагировали на ее появление сразу, то ли она уже встречается с кем-то еще. Использование механизмов прозрачности, позволяющих выявить честные сигналы в поведении пользователя, – лучший подход по сравнению с навязыванием жестких рамок. Например, в каждом профайле может быть видно, сколько сообщений отправил и получил этот человек за последние сутки, неделю и месяц, а также средние частоту и скорость откликов. Это позволит более обоснованно решать, с кем контактировать.

Подобная информация уже используется в некоторых приложениях знакомств. Приложение знакомств для геев Jack’s предоставляет информацию о частоте откликов на входящие сообщения и описательную статистику (возрастной диапазон, этническая принадлежность, телосложение и т. п.) по людям, которыми действительно интересовался данный пользователь (а не только то, что он описывает в своем профайле в качестве интересующих его черт). Такая прозрачность позволяет пользователям лучше понимать не только имеющиеся варианты, но и свои шансы. Если интересующий вас персонаж отвечает только на 12 процентов сообщений, то, наверное, лучше потратить время на знакомство с кем-то еще, тем более что 64 процента интересующих его пользователей сообщают о своей «накачанности», а это совсем не про вас. Для получения большей достоверности о вкусах пользователей Jack’s опирается не на статистику просмотров или входящих и исходящих сообщений, а исключительно на анализ списка «Избранных», а также специальной функции, позволяющей пользователям выражать свою заинтересованность в знакомстве. Эта опция направляет информацию в базу данных только в случае взаимного интереса.

Самая богатая и более персонализированная по сравнению с этими прямыми сигналами информация, которой обладает любой сайт знакомств, содержится в истории просмотров профайлов каждым пользователем. Однако интерпретировать мотивы этих просмотров достаточно сложно. Работая с сайтом Match.com, я обнаружил пользователя, который заблокировал доступ к себе огромному количеству черных женщин. Скорее всего, это был расист, правильно? Неправильно! Посмотрев на установки его фильтра и его просмотры, мы убедились в том, что все обстоит ровно наоборот: он интересовался именно черными женщинами, причем только теми, кто описывал себя «фигуристыми». Для экономии времени и сил он блокировал пользователей-женщин, попытки познакомиться с которыми оказались неудачными. Информационным детективам приходится решать и такие забавные задачки. А способность обнаруживать интересные случаи и рассказывать о них – важная составляющая умения понимать информацию.

Чтобы правильно трактовать данные, надо встать на точку зрения пользователя. Здесь очень важна обстановка. По ходу дня наши желания меняются, или же это происходит по ходу ночи. Когда я консультировал сингапурский сайт знакомств Fridae, мы заметили, что типы профайлов, просматриваемых в два часа дня пятницы, отличаются от просматриваемых в два часа ночи субботы. В этой связи научной команде Fridae предстояло решить, как использовать эту информацию в рэнкингах, представленных на сайте.

Сайты знакомств все чаще предлагают пользователям возможность раскрыть свою «истинную сущность», стимулируя их добавлять в профайл кнопки ссылок на аккаунты в Facebook, Instagram или Twitter. Но это не значит, что случаи предосудительного поведения пользователей прекратились. Себастиан Боэр, один из специалистов по обработке данных мобильной платформы знакомств Skout, написал алгоритм фильтрации неприемлемых сообщений, под неформальным названием «гадоистребитель» [127]. Что считалось неприемлемым? Это определялось по кликам и взаимодействию пользователей. Если огромное количество пользователей блокировали кого-то определенного, то с большой долей вероятности можно было судить о том, что он – неприятный тип. А тот, кто постоянно слал безответные сообщения конкретному пользователю, явно был неприятен последнему. Со временем алгоритм научился распознавать содержание сообщений, которые обычно остаются без ответа или приводят к блокировке отправителя. Обычно в них присутствовал негатив. Очевидным признаком могли бы служить неприличные выражения, однако определение неприемлемости – значительно более тонкое дело. То, что кажется отвратительным одному человеку, может выглядеть привлекательным для другого. При выявлении закономерностей в блокировках «гадоистребитель» блокировал доставку сообщений. Кроме этого алгоритм пресекал избыточную отправку безответных сообщений какому-то конкретному пользователю. Задачей «гадоистребителя» было поддержание позитивной среды для большинства пользователей.

В начале этой главы я писал о том, как мое образование и опыт физика помогли мне в создании, проведении и анализе результатов экспериментов с социальными данными. Многие из этих экспериментов подразумевают наблюдение за тем, как изменения в порядке переработки данных влияют на изменения в поведении людей. Если пользователь приложения знакомств увидит, что объект его интереса редко отвечает на сообщения, будет ли он тратить время на написание душевного послания или переключит внимание на кого-то с большей вероятностью отклика? Что скорее заставит негодяя прекратить рассылку своих писем – просьба администратора или нулевая реакция пользователей? Где проходит тонкая грань экспериментов с идентичностью, переступив которую человек начинает выглядеть в глазах окружающих мошенником? Большая прозрачность поведения пользователей позволяет людям самостоятельно решать, насколько представленный в профайле персонаж соответствует их идеалу родственной души.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Андреас Вайгенд читать все книги автора по порядку

Андреас Вайгенд - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




BIG DATA. Вся технология в одной книге отзывы


Отзывы читателей о книге BIG DATA. Вся технология в одной книге, автор: Андреас Вайгенд. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x