Сет Cтивенс-Давидовиц - Все лгут. Поисковики, Big Data и Интернет знают о вас всё

Тут можно читать онлайн Сет Cтивенс-Давидовиц - Все лгут. Поисковики, Big Data и Интернет знают о вас всё - бесплатно ознакомительный отрывок. Жанр: Прочая научная литература, издательство Литагент 5 редакция «БОМБОРА», год 2018. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Сет Cтивенс-Давидовиц - Все лгут. Поисковики, Big Data и Интернет знают о вас всё краткое содержание

Все лгут. Поисковики, Big Data и Интернет знают о вас всё - описание и краткое содержание, автор Сет Cтивенс-Давидовиц, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Люди склонны преувеличивать и не договаривать, опросы не показывают всей картины, исследования недостаточно репрезентативны ‒ в общем, лгут все… Кроме Big Data! Перед вами сенсационная книга о том, как при помощи больших данных и современных технологий можно узнать всю подноготную современного общества. Автор этой книги, специалист Google по Data Science, выяснил, что скрывают люди, какие они на самом деле, а не какими хотят казаться. Что же он узнал?

Все лгут. Поисковики, Big Data и Интернет знают о вас всё - читать онлайн бесплатно ознакомительный отрывок

Все лгут. Поисковики, Big Data и Интернет знают о вас всё - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Сет Cтивенс-Давидовиц
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Другими словами, данные в интернете могут подсказать компаниям, каких клиентов стоит избегать, а каких использовать. Они также могут подсказать клиентам, с какими фирмами не стоит связываться, а также какие из них пытаются их, клиентов, использовать. На сегодняшний день большие данные помогают обеим сторонам в борьбе друг с другом. Мы должны убедиться, что борьба по-прежнему честная.

Опасность вооруженных данными правительств

Когда ее бывший бойфренд пришел на вечеринку по поводу дня рождения, Адриана Донато поняла, что он расстроен. Ей показалось, что он сошел с ума. Она знала, что он боролся с депрессией. Когда он пригласил ее покататься на машине, Донато, 20-летняя студентка-зоолог, не знала только одного. Она не знала, что ее бывший бойфренд, 22-летний Джеймс Стоунхэм, предыдущие три недели провел в поисках информации о том, как кого-то убить, и о наказании за убийство, вперемешку с редкими запросами о самой Адриане.

Если бы она знала это, она бы наверняка не села с ним в машину. И, скорее всего, он бы не зарезал ее в тот вечер.

В фильме «Особое мнение» экстрасенсы сотрудничают с полицией, чтобы предотвратить преступления еще до их возникновения. Следует ли для тех же целей предоставить большие данные и отделениям полиции? Нужно ли было по крайней мере предупредить Донато о поисковых запросах ее бывшего бойфренда, а полиции – допросить Стоунхэма?

Во-первых, следует признать: находится все больше доказательств того, что поисковые запросы в Google относительно преступной деятельности напрямую коррелируют с этой самой преступной деятельностью. Кристина Ма-Келламс, Флора Ор, Чжи Хен Баек и Ичиро Кавачи доказали, что количество запросов в Google, связанных с суицидом [227] Christine Ma-Kellams, Flora Or, Ji Hyun Baek, and Ichiro Kawachi, «Rethinking Suicide Surveillance: Google Search Data and Self-Reported Suicidality Differentially Estimate Completed Suicide Risk», Clinical Psychological Science 4, no. 3 (2016). , сильно коррелирует с количеством самоубийств. Кроме того, мы с Эваном Солтасом обнаружили, что еженедельное число исламофобских поисковых запросов – например, с текстом «я ненавижу мусульман» или «надо убивать мусульман» – напрямую коррелирует с количеством преступлений против мусульман на этой неделе. Если большее число людей выполняет поисковые запросы с сообщением о своем желании что-то сделать, это значит, что большее число людей это сделают.

Так как же нам быть с этой информацией? Есть одна простая и достаточно бесспорная идея: мы можем использовать данные по территориям. Если в каком-то городе сильно растет число поисковых запросов, связанных с самоубийством, мы можем быть уверены в том, что количество суицидов там также возрастет. Значит, местным властям или некоммерческим организациям пора запускать рекламу, объясняя, где люди могут получить психологическую помощь. Аналогично, если в городе сильно возросло число запросов «убивать мусульман», отделениям полиции стоит изменить принцип патрулирования улиц – например, можно направить больше сотрудников к местной мечети.

Но один шаг нам делать не слишком приятно: преследовать людей еще до того, как они совершат преступление. Нам кажется, что это вторжение в частную жизнь. С точки зрения этики, существует большая разница между возможностью правительства собирать информацию о поисковых запросах тысяч или сотен тысяч людей и возможностью полиции записывать аналогичные данные конкретного человека. С точки зрения этики, существует большая разница между защитой местной мечети и возможностью обшарить чужой дом. С точки зрения этики, существует большая разница между рекламой профилактики самоубийств и заключением кого бы то ни было в психиатрическую больницу против его воли.

Однако причина быть предельно осторожными с использованием информации личного характера выходит даже за рамки этики. Она заключается и в самих данных. С точки зрения науки о данных, есть большая разница между попытками предугадать вероятность определенных событий в городе и старанием предсказать действия отдельного человека.

Давайте вернемся к самоубийству. Каждый месяц в США делается около 3,5 миллиона связанных с суицидом поисковых запросов [228] Здесь используется методика, изложенная на моем сайте в примечаниях. Я сравниваю поиск в Google «самоубийства» c поиском «как завязать галстук». В 2015 году насчитывалось 6,6 миллионов запросов в Google «как завязать галстук». А поисков в категории «самоубийства» было в 6,5 раз больше. 6,5 × 6,6 / 12 = 3,5. . При этом в большинстве из них есть определенные намеки – слова «самоубийца», «самоубийство» и «способы самоубийства». Проще говоря, каждый месяц – больше одного запроса о самоубийстве на каждые 100 американцев. Как тут не вспомнить философа Фридриха Ницше: «Мысль о самоубийстве – это великое утешение: она помогает человеку преодолеть темноту ночи». Данные поисковых запросов в Google показывают, как это верно и насколько распространены мысли о суициде. Тем не менее каждый месяц в Соединенных Штатах совершается менее четырех тысяч самоубийств. То есть суицидальные мысли достаточно распространены, а самоубийства – нет. Поэтому полицейским нет смысла стучаться в двери каждый раз, когда кто-либо сообщает онлайн о желании вышибить себе мозги – если копы будут заниматься этим, у них ни на что больше не останется времени.

Или рассмотрим невероятно злобные исламофобские запросы. В 2015 году в Соединенных Штатах примерно 12 тысяч раз искали выражение «убивать мусульман». И, как сообщалось, на почве ненависти были убиты 12 мусульман [229] Bridge Initiative Team, «When Islamophobia Turns Violent: The 2016 U. S. Presidential Election», May 2, 2016, можно найти на http://bridge.georgetown.edu/when-islamophobia-turns-violent-the-2016-u-s-presidential-elections/. . Очевидно, что подавляющее большинство людей, делавших этот ужасающий запрос, не доходят до осуществления соответствующего действия.

Существуют математические выкладки, объясняющие разницу между предсказанием поведения конкретной личности и общей ситуацией в городе. Вот простой мысленный эксперимент. Предположим, в городе живет один миллион человек. И там есть одна мечеть. Предположим, что если кто-то не обратится к Google с запросом «убить мусульман», то он нападет на мечеть с вероятностью всего 1 на 100 миллионов. Предположим, что кто-то начнет искать в Сети выражение «убить мусульман». Тогда эта вероятность резко возрастает до 1 к 10 тысячам. Предположим, что исламофобия взлетела до небес и число поисковых запросов «убить мусульман» выросло со 100 до 1000.

Как показывает математика, в этой ситуации шансы нападения на мечеть возросли примерно в пять раз – с 2 до 10 процентов. Но вероятность того, что человек, писавший «убить мусульман», действительно нападет на мечеть, по-прежнему остается только 1 на 10 тысяч.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Сет Cтивенс-Давидовиц читать все книги автора по порядку

Сет Cтивенс-Давидовиц - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Все лгут. Поисковики, Big Data и Интернет знают о вас всё отзывы


Отзывы читателей о книге Все лгут. Поисковики, Big Data и Интернет знают о вас всё, автор: Сет Cтивенс-Давидовиц. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x