Сет Cтивенс-Давидовиц - Все лгут. Поисковики, Big Data и Интернет знают о вас всё
- Название:Все лгут. Поисковики, Big Data и Интернет знают о вас всё
- Автор:
- Жанр:
- Издательство:Литагент 5 редакция «БОМБОРА»
- Год:2018
- Город:Москва
- ISBN:978-5-04-090836-3
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Сет Cтивенс-Давидовиц - Все лгут. Поисковики, Big Data и Интернет знают о вас всё краткое содержание
Все лгут. Поисковики, Big Data и Интернет знают о вас всё - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Он хотел найти способ более четко оценивать различные экономические показатели. Его решение – это отличный пример того, как можно переосмыслить данные и какова их реальная ценность.
Райзингер основал компанию «Premise», в которой работают группы сотрудников из развивающихся стран, вооруженные смартфонами. В чем заключается их работа? Фотографировать интересные происшествия, которые могут иметь какое-либо экономическое значение.
Сотрудники, вооружившись смартфонами, могут делать снимки АЗС или фруктовых корзин в супермаркетах. Они фотографируют одни и те же места снова и снова. Фотографии отправляются в головной офис компании, где вторая группа сотрудников – компьютерщики – превращают фотографии в информацию.
Специалисты компании могут проанализировать все – от длины очередей на заправках до того, сколько яблок лежит в корзине в супермаркете, и до цены этих яблок. На основе самых разных фотографий любых видов деятельности компания может начать оценивать уровень экономической активности и инфляции. В развивающихся странах длинные очереди на АЗС – основной индикатор экономических проблем. Равно как недозрелые яблоки и их отсутствие. Снимки, сделанные в Китае, помогли обнаружить продовольственную инфляцию в 2011 году и продовольственную дефляцию в 2012 году – задолго до появления официальных данных.
«Premise» продает эту информацию банкам или хедж-фондам, а также сотрудничает со Всемирным банком.
Как и многие хорошие идеи, «Premise» продолжает приносить пользу. Недавно Всемирный банк заинтересовался размерами теневой экономики на Филиппинах, связанной с сигаретами. В частности, он хотел знать последствия недавних шагов правительства, включавших случайные рейды против производителей сигарет, не уплачивающих налоги. Что придумала компания «Premise»? Фотографировать табачные киоски на улице. Посмотрим, на скольких из них имеются акцизные марки, которые отличают законные сигареты. Было обнаружено, что эта часть теневой экономики, бывшая достаточно обширной в 2015 году, в 2016-м стала значительно меньше. Усилия правительства принесли результат, хотя для того, чтобы понять объем скрытого товара (нелегальных сигарет), требуются новые данные.
Как мы видели, эпоха цифровых технологий принесла совершенно новое понимание того, что считать данными, и из новой информации было сделано много интересных выводов. Знание причин, заставляющих СМИ смещать тональность своих выступлений влево или вправо, обеспечивающих успех первого свидания и возможность выявления хорошо развивающиейся экономики – это только начало.
Неслучайно на основе этих новых данных было сделано немало денег – начиная с десятков миллиардов господ Брина и Пейджа. Джозеф Райзингер также работает не в убыток себе. Обозреватели подсчитали, что годовой доход «Premise» сегодня составляет десятки миллионов долларов. Недавно инвесторы влили в компанию еще 50 миллионов [84] Leena Rao, «SpaceX and Tesla Backer Just Invested $50 Million in This Startup» («Spacex и Tesla Backer просто вложили 50 миллионов долларов в стартап»), Fortune , 24 сентября 2015 года.
. Это означает, что некоторые из них считают «Premise» одним из самых выгодных предприятий в мире – в первую очередь, в области создания и использования фотографий. То есть в той же лиге, что и «Playboy».
Другими словами, новые типы данных имеют огромное значение как для ученых, так и для предпринимателей. При этом понятие данных в последнее время значительно расширилось. Сегодня специалисты не должны ограничивать себя узким или традиционным представлением о них. В наши дни фотографии очередей в супермаркетах – ценные данные. Наполнение полок там же – данные. Спелость яблок – данные. Фотографии из космоса – данные. Кривизна линии губ – тоже данные. Любая информация!
И все эти новые сведения мы наконец можем увидеть даже сквозь прикрывающую их ложь.
Глава 4
Цифровая сыворотка правды
Все врут. О том, сколько выпили по дороге домой. О том, как часто ходят в тренажерный зал, сколько стоят эти новые туфли, будут ли читать эту книгу. Они говорят, что больны, когда вполне здоровы. Они говорят, что будут на связи, когда не собираются этого делать. Они утверждают, что говорят не о вас, хотя именно вас они и обсуждали. Они говорят, что любят вас, хотя на самом деле это не так. Они говорят, что счастливы, хотя в действительности хандрят. Они говорят, что им нравятся женщины, тогда как предпочитают мужчин. Люди врут друзьям. Боссам. Детям. Родителям. Они обманывают врачей и мужей. Лгут женам. Они врут сами себе.
И они – я совершенно в этом уверен – врут во время опросов.
Вот вам краткий обзор:
Вы когда-нибудь жульничали на экзамене? ____________________
Вы когда-нибудь мечтали кого-нибудь убить? ____________________
Вам когда-нибудь хотелось соврать? Многие люди при опросах занижают количество случаев неловкого поведения и дурных мыслей. Они хотят хорошо выглядеть, хотя большинство опросов анонимны. Это называется «социально приемлемое смещение».
Одна серьезная статья 1950 года [85] Hugh J. Parry and Helen M. Crossley, «Validity of Responses to Survey Questions» («Достоверность ответов на вопросы анкеты»), Public Opinion Quarterly 14, 1 (1950).
представила веские доказательства того, как опросы могут пасть жертвой этого явления. Исследователи собрали из официальных источников данные о жителях Денвера: сколько процентов из них голосовали, давали деньги на благотворительность и имеют читательский билет в библиотеке. Затем они сами опросили денверцев – чтобы увидеть, насколько эти показатели совпадают с реальностью. Результаты оказались шокирующими. То, что люди сообщали в анкетах, сильно отличалось от сведений, собранных учеными. Хотя никто не подписывал анкету, все в основном преувеличивали свой регистрационный статус избирателя, стремление голосовать и участие в благотворительности.
Сообщено в ходе опроса, % – Официальные данные, %
Регистрационный статус избирателя – 83 – 69
Голосовал на последних президентских выборах – 73 – 61
Голосовал на последних выборах мэра – 63 – 36
Имеет читательский билет в библиотеке – 20 – 13
Давал деньги на благотворительность – 67 – 33
Изменилось ли что-либо за 65 лет? В век интернета отсутствие библиотечного читательского билета никого больше не смущает. Но несмотря на изменение представлений о неудобном или нежелательном, стремление людей обманывать социологов остается весьма сильным.
Во время недавнего исследования выпускникам университета Мэриленда задавали различные вопросы об их жизни во время учебы [86] Frauke Kreuter, Stanley Presser, and Roger Tourangeau. «Social Desirability Bias in CATI, IVR, and Web Surveys» («Смещение социальной желательности в CATI, IVR и веб-опросах», Public Opinion Quarterly 72(5), 2008.
. Ответы сопоставлялись с официальными отчетами. Люди постоянно давали неверную информацию, что позволяло им выглядеть лучше, чем они были на самом деле. Меньше 2 % опрошенных сообщили, что закончили обучение со средним баллом ниже 2,5 (в действительности таких было около 11 %). А 44 % заявили, что в прошлом году они сделали пожертвование университету (в действительности таких было около 28 %).
Интервал:
Закладка: