Сет Cтивенс-Давидовиц - Все лгут. Поисковики, Big Data и Интернет знают о вас всё
- Название:Все лгут. Поисковики, Big Data и Интернет знают о вас всё
- Автор:
- Жанр:
- Издательство:Литагент 5 редакция «БОМБОРА»
- Год:2018
- Город:Москва
- ISBN:978-5-04-090836-3
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Сет Cтивенс-Давидовиц - Все лгут. Поисковики, Big Data и Интернет знают о вас всё краткое содержание
Все лгут. Поисковики, Big Data и Интернет знают о вас всё - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Вы можете спросить: а что насчет женщин – любительниц бейсбола? Здесь зависимость выражена намного менее ярко, а возрастной пик, похоже, приходится на возраст около 22 лет.
Это мое любимое исследование. Оно касается двух моих самых обожаемых тем – бейсбола и источников моей взрослой неудовлетворенности. Я прочно подсел на бейсбол в 1986 году и страдал в одиночестве, болея за «Метс» – и болею до сих пор. Ной родился четыре года спустя и был избавлен от этого.
Сегодня бейсбол – не самая важная тема в мире, по крайней мере так неоднократно говорил мне мой консультант, доктор философии. Но моя методика может помочь нам решить подобные вопросы – в том числе показать, как люди формируют свои политические или сексуальные предпочтения, музыкальные вкусы и финансовые привычки. (Мне было бы особенно интересно узнать о происхождении сумасшедших идей моего брата в области последних двух тем.) Полагаю, мы увидим, что многие из наших взрослых привычек и интересов (даже те, которые мы считаем основополагающими) могут быть объяснены произвольными фактами – датой нашего рождения или тем, что происходило в те несколько ключевых лет, пока мы были молоды.
Конечно, подобные работы уже проводились, они касались происхождения политических предпочтений. Яир Гитца, главный научный сотрудник компании «Catalist», занимающейся анализом данных, и Эндрю Гельман, политолог, статистик Колумбийского университета, пытались проверить расхожую мысль о том, что большинство людей начинают с либеральных идей, но с возрастом скатываются в консерватизм. Это мнение выражено известной цитатой, часто приписываемой Уинстону Черчиллю: «Если человеку еще нет 30 и он не либерал, значит, у него нет сердца; если человеку уже за 30 и он не консерватор, значит у него нет мозгов».
Гитца и Гельман потратили 60 лет на обработку данных исследований, включивших в себя более 300 тысяч наблюдений за предпочтениями избирателей. И обнаружили, вопреки утверждению Черчилля, что подростки иногда придерживаются либеральных взглядов, а иногда – консервативных. То же самое касается людей среднего возраста и пожилых.
Их работа явно продемонстрировала, что политические взгляды на самом деле формируются точно так же, как и спортивные предпочтения. Есть критический период, оказывающий решающее влияние на всю остальную жизнь. Между 14 и 24 годами множество американцев формируют свое мнение, основываясь на славе президента. Популярный республиканец или непопулярный демократ – и многие молодые люди станут республиканцами. Наоборот – и очередное поколение пополнит колонны демократов. И эти взгляды, обретенные в ключевой период, у большинства американцев останутся на всю жизнь.
Чтобы увидеть, как это работает, сравните предпочтения американцев, родившихся в 1941 году, и тех, кто родился десятилетие спустя.
Представители первой группы достигли совершеннолетия во время президентства популярного республиканца Дуайта Эйзенхауэра. В начале 1960-х, несмотря на то, что этим людям было под 30, они в основном голосовали за представителя Республиканской партии. И даже старея, представители этого поколения постоянно склонялись к поддержке республиканцев.
Американцы, родившиеся на 10 лет позже – беби-бумеры, – достигли совершеннолетия во время президентства Джона Ф. Кеннеди, чрезвычайно популярного демократа. Линдон Джонсон был изначально прославленным демократом. Ричард Никсон являлся республиканцем, который в конечном счете ушел в отставку с позором. Представители этого поколения всю свою жизнь склонялись к либеральному образу мыслей.
Имея все эти данные, исследователи смогли определить самый важный возраст для выработки политических взглядов – 18 лет.
Они обнаружили, что этот эффект импринтинга очень важен. Их модель предполагает, что в результате президентства Эйзенхауэра число республиканцев, родившихся в 1941 году, увеличилось на 10 %. Кеннеди, Джонсон и Никсон увеличили количество демократов среди американцев, родившихся в 1952 году, на 7 %.
Я дал понять, что скептически отношусь к данным исследования, но меня впечатляет количество рассмотренных откликов. В действительности подобная работа не могла быть сделана на основании одного небольшого опроса. Чтобы увидеть, как именно меняются предпочтения с возрастом, ученым нужны были сотни тысяч наблюдений и обобщения многих исследований.
Для моего анализа любви или нелюбви к бейсболу объем данных также имел решающее значение. Мне нужно было узнать не только количество болельщиков каждой команды, но и разбить их по возрасту. Для этого требуются миллионы наблюдений – и Facebook вместе с другими цифровыми источниками способны предоставить нам подобную информацию.
Здесь вступает в игру объем исследуемой статистики. Нужно иметь много пикселей в фотографии, чтобы можно было увеличить четкость изображения одной ее малой части. Аналогично, необходимо много наблюдений в общем массиве данных для того, чтобы иметь возможность увеличить четкость одного небольшого подмножества – например, сказать, насколько популярна команда «Метс» среди мужчин 1978 года рождения. Небольшой опрос пары тысяч человек не будет достаточно большой выборкой.
Это третье достоинство больших данных: они позволяют рассмотреть вблизи мелкие сегменты большого массива – чтобы получить новую информацию о том, кто мы есть. Можем присмотреться и к другим параметрам помимо возраста. Если у нас есть достаточно информации, мы в состоянии понять, как ведут себя люди, живущие в определенных городах и поселках. Мы можем посмотреть даже, как они действуют ежечасно и ежеминутно.
В этой главе мы пристально посмотрим на поведение людей.
Что на самом деле происходит в наших регионах, городах и поселках?
Оглядываясь назад, все кажется удивительным. Но когда Радж Четти, ставший затем профессором в Гарварде, и его небольшая исследовательская группа впервые изучили довольно большой набор данных – налоговые записи всех американцев с 1996 года, – они не были уверены в какой-либо его пользе. Налоговая передала им эту информацию, поскольку ее руководство сочло, что исследователи могли бы использовать ее для прояснения последствий налоговой политики.
Первоначальные попытки Четти и его команды использовать эту статистику заводили их в многочисленные тупики. Их анализ последствий Федеральной налоговой политики и налоговой политики штатов приводил в основном к тем же выводам, которые получали все остальные исследователи, работавшие только с этой информацией. Возможно, результаты Четти, использовавшего сотни миллионов единиц данных налоговой службы, были немного более точными. Но получение практически такого же результата, как и у остальных, не является серьезным достижением социальной науки. Это не тот тип работы, о котором готовы писать в лучших научных журналах.
Читать дальшеИнтервал:
Закладка: