Нейт Сильвер - Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет
- Название:Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет
- Автор:
- Жанр:
- Издательство:Array Литагент «Аттикус»
- Год:2015
- Город:Москва
- ISBN:978-5-389-09938-8
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Нейт Сильвер - Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет краткое содержание
О том, как этому научиться, рассказывает Нейт Сильвер, политический визионер и гуру статистики, разработавший систему прогнозов, позволившую дважды максимально точно предсказать результаты президентских выборов почти во всех штатах Америки. Его книга во многом близка исследованиям Нассима Талеба и столь же значима для всех, кто имеет дело с большими объемами данных и просчитывает различные варианты развития событий. И если Талеб говорит о законах зарождения «черных лебедей», Сильвер исследует модели и способы, позволяющие поймать этих птиц в расставленные нами сети. Он обобщает опыт экспертов-практиков, изучает различные модели и подходы, позволяющие делать более точные прогнозы. Как и Даниэль Канеман, автор бестселлера «Думай медленно… Решай быстро», наблюдая за поведением и мышлением людей, оценивающих неопределенные события, Сильвер утверждает: да, компьютеры незаменимы при работе с огромными массивами данных, но для максимальной точности результатов необходим гибкий человеческий ум и опыт, ведь прогнозирование – это планирование в условиях неопределенности.
Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Все больше и больше профессионалов пытается применять аналогичный подход к предсказанию развития болезней на основе агентного моделирования [100]. Я побывал в Питтсбургском университете и встретился с исследователями, находящимися на передовом крае разработки этой методики. Для названия своей модели команда использует аббревиатуру FRED, которая расшифровывается как «основа реконструкции динамики эпидемий» (framework for reconstruction of epidemic dynamics). Одновременно это имя является своеобразной данью уважения уроженцу Питтсбурга Фреду Роджерсу, бывшему ведущему детского телевизионного шоу «Mister Rogers’ Neighborhood».
Питтсбург, как и Чикаго, – это город, состоящий из пригородов. Размышляя о болезни, исследователи постоянно апеллируют к ним, и поэтому FRED представляет собой своеобразный аналог Питтсбурга – СимПиттсбург (SimPittsburgh) – невероятно детальную имитационную модель, в которой каждый человек представлен «агентом», имеющим семью, сеть социальных контактов, место жительства и набор убеждений и манер поведения, соответствующих его социально-экономическому статусу.
Доктор Джон Грефенстетте, один из ученых питтсбургской команды, прожил в этом городе значительную часть своей жизни, однако до сих пор говорит с заметным иностранным акцентом. Он рассказал мне, как организована работа FRED: «Школы, офисы и больницы размещены в этой модели так же, как в реальном городе. У жителей нашей системы имеются вполне реальные проблемы при записи детей в школы; они не всегда ходят в самую ближнюю – а кроме того, некоторые школы слишком малы, в то время как другие огромны. Это чем-то напоминает игру SimCity». Доктор Грефенстетте и его любезный коллега доктор Шон Браун показали мне некоторые результаты имитационного моделирования, полученные с использованием FRED, на которых волны болезней, раскрашенные разным цветом, распространялись по районам СимПиттсбурга, СимВашингтона или СимФиладельфии. Однако при этом FRED – это серьезный бизнес. Модели такого рода не ищут легких путей, в них должны быть представлены практически все жители города, графства или штата.
Некоторые модели, основанные на агентах, пытаются даже имитировать всю страну или весь мир. Как и погодные модели, они требуют проведения огромного количества расчетов, а следовательно, использования суперкомпьютеров. Естественно, что при проведении расчетов такого рода необходимо правильно учесть демографические данные (это вполне можно сделать, используя результаты переписи населения). Однако модели также должны принимать во внимание куда менее предсказуемое человеческое поведение. Например, насколько велика вероятность того, что 26-летняя мать-одиночка-латиноамериканка пойдет делать прививку? Вы можете провести опрос и спросить ее – основанные на агентах модели довольно сильно полагаются на данные опросов. Однако люди на удивление часто лгут (или забывают), когда речь идет об их действиях, связанных с охраной здоровья: так, они заявляют, что моют руки {529}или используют презервативы {530}гораздо чаще, чем это происходит в реальности.
По словам доктора Грефенстетте, одно довольно устоявшееся правило заключается в следующем: люди готовы принимать участие в неудобных, но ведущих к оздоровлению действиях, таких как вакцинации, если они связаны с достаточно высоким, по их мнению, риском заболеть. Жительница СимПиттсбурга получит прививку от гриппа, если будет считать риск свиного гриппа серьезным. Однако как изменится ее представление о происходящем, если заболеет ее сосед или даже ребенок? Что, если в местных новостях постоянно рассказывают случаи, связанные с гриппом? Самореализующиеся и самоотменяющиеся свойства предсказания заболеваний играют огромную роль в этих моделях с использованием агентов. Поскольку они динамичны и позволяют поведению агента меняться со временем, то в какой-то момент дают возможность получить ответы и на заданные мной чуть выше вопросы.
Можно посмотреть и на работу доктора Даума и его команды из Чикагского университета, которые строят модели, основанные на агентах, для изучения распространения опасного заболевания под названием MRSA [101]-инфекции. Вызывающие ее стафилококки устойчивы к антибиотикам, и в результате обычные ссадины, порезы и синяки могут стать опасными для жизни, а порой привести к неизлечимому заболеванию. MRSA-инфекция – это сложное заболевание с множеством путей распространения: через объятия, открытые раны или через пот или кровь. Порой они могут задерживаться на различных поверхностях, таких как столешницы или полотенца. Часто следы MRSA можно найти в раздевалках, в которых спортсмены обмениваются снаряжением; всплески MRSA время от времени фиксируются у членов футбольных команд разного уровня – от школьных до профессиональных. Задача усложняется еще и потому, что многие люди являются носителями бактерии MRSA, но не заболевают и не страдают от присущих болезни симптомов.
Предпринимая попытку смоделировать действие MRSA, Даум и его коллеги задают себе примерно такие вопросы: люди какого типа используют пластыри, если они получили ссадину или порез? Насколько распространены объятия среди представителей разных культур? Какая доля жителей пригорода сидела в тюрьмах (где стафилококковые инфекции встречаются чаще обычного)?
Используя традиционные модели, даже нельзя рассчитывать на то, чтобы учитывать ответы на подобные вопросы, но модели, основанные на агентах, могут, по крайней мере, предложить нам шанс получить точные прогнозы. Однако командам из Питтсбурга и Чикаго приходится принимать во внимание множество довольно разнообразных переменных. И это необходимо делать всякий раз, когда вы пытаетесь оценивать поведение каждого жителя большой популяции. Работа часто заставляет их изучать вопросы когнитивной психологии, поведенческой экономики, этнографии и даже антропологии: модели, основанные на агентах, используются для изучения ВИЧ-инфекции в различных сообществах – от жителей джунглей Папуа – Новой Гвинеи {531}до завсегдатаев гей-баров Амстердама {532}. И в этом случае нужны довольно глубокие знания местных обычаев и привычек.
Учитывая вышесказанное, стоит заметить: агентное моделирование – исключительно смелое занятие, и в группах, работающих в этой области, часто собраны звезды из лучших и ярчайших представителей различных дисциплин. Однако даже при наличии всей этой интеллектуальной элиты их усилия часто подрываются нехваткой данных. «Даже в случае H1N1 довольно сложно получить детальные географические данные о том, кто, когда и где заболел, – жалуется Грефенстетте. – И вы не поверите, насколько сложно получать данные о всплесках болезни, имевших место в прошлом».
Читать дальшеИнтервал:
Закладка: