Нейт Сильвер - Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет
- Название:Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет
- Автор:
- Жанр:
- Издательство:Array Литагент «Аттикус»
- Год:2015
- Город:Москва
- ISBN:978-5-389-09938-8
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Нейт Сильвер - Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет краткое содержание
О том, как этому научиться, рассказывает Нейт Сильвер, политический визионер и гуру статистики, разработавший систему прогнозов, позволившую дважды максимально точно предсказать результаты президентских выборов почти во всех штатах Америки. Его книга во многом близка исследованиям Нассима Талеба и столь же значима для всех, кто имеет дело с большими объемами данных и просчитывает различные варианты развития событий. И если Талеб говорит о законах зарождения «черных лебедей», Сильвер исследует модели и способы, позволяющие поймать этих птиц в расставленные нами сети. Он обобщает опыт экспертов-практиков, изучает различные модели и подходы, позволяющие делать более точные прогнозы. Как и Даниэль Канеман, автор бестселлера «Думай медленно… Решай быстро», наблюдая за поведением и мышлением людей, оценивающих неопределенные события, Сильвер утверждает: да, компьютеры незаменимы при работе с огромными массивами данных, но для максимальной точности результатов необходим гибкий человеческий ум и опыт, ведь прогнозирование – это планирование в условиях неопределенности.
Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
В чем бы ни состояла причина, было ясно, что это специфическое и локализованное поведение не вполне соответствует простым моделям заболевания – к счастью, в данном случае это означало, что прогнозы исследователей в отношении ВИЧ оказались слишком пугающими. Модели, основанные на различных состояниях, предполагают, что у каждого человека имеется свой уровень восприимчивости к болезни. Это допущение не работает столь же точно в случае болезней, требующих более близкого контакта, или в случаях, когда уровень риска является асимметричным для различных групп населения. Иными словами, вы не можете зайти в продуктовый магазин и выйти из него зараженным ВИЧ.
Почему не сработали модели в Форт-Дикс
Однако даже в случае более простых заболеваний компартментальные модели [97]могут оказаться неприменимыми из-за слишком общих и нестрогих допущений, заложенных в них. Рассмотрим, например, корь.
Корь – это первая болезнь, которую (вследствие ее простоты) начинают изучать будущие эпидемиологи в рамках программы PhD [98]. «Корь представляет собой удобную модель для изучения системы инфекционного заболевания, – утверждает Марк Липсиц, коллега Озоноффа по Гарварду. – Она одномерна. Ее можно выявить с помощью анализа крови, у нее имеется лишь один штамм, и у всех заболевших проявляются одни и те же симптомы. Переболев ею, вы не заразитесь второй раз». Если бы нужно было назвать единственную болезнь, идеально описываемую SIR-моделью, то специалисты выбрали бы корь.
Однако в 1980‑х и начале 1990‑х гг. в Чикаго был зафиксирован ряд необычно тяжелых всплесков кори, которые эпидемиологи не могли предсказать. В соответствии с традиционной моделью, прививки имелись у такого количества жителей города, которого должно было быть достаточного для формирования так называемого коллективного иммунитета – своего рода биологического эквивалента брандмауэра, благодаря которому болезнь не имеет возможности развиваться и затухает сама собой. Однако в отдельные годы на протяжении 1980‑х корью заболевало не менее 1000 жителей города – в основном маленькие дети. Проблема показалась настолько тревожной, что власти приказали медсестрам ходить от двери к двери и делать жителям прививки {525}.
Доктор Роберт Даум, педиатр и специалист по инфекционным заболеваниям, работавший в нескольких больницах Чикагского университета, серьезно изучил эти всплески кори. Даум – настоящий идеал врача. У него глубокий голос, огромная борода и потрясающее чувство юмора. Незадолго до встречи со мной в Чикаго Даум вернулся с Гаити, где вместе с коллегами помогал преодолевать последствия землетрясения 2010 г.
Чикаго, в котором я прожил 13 лет, – это город пригородов. Зачастую пригороды бывают достаточно сегрегированы либо по расовому составу, либо по социально-экономическим признакам. Даум обнаружил, что население пригородов также различалось по отношению к прививкам. Небогатые афроамериканцы, жившие в районах типа Саус-Сайд, неохотно разрешали прививать своих детей вакциной MMR (против кори, свинки и краснухи). Непривитые дети вместе ходили в школу, вместе играли, кашляя и чихая друг на друга. Их поведение отвергало одно из предположений модели SAR о так называемом случайном смешивании, согласно которому любые два человека имеют одинаковый шанс вступить в контакт друг с другом. И понятно было, что эти дети как раз и явились распространителями кори.
Именно это явление неслучайного перемешивания и стало причиной «фиаско свиного гриппа» в 1976 г., когда ученые посчитали H1N1 угрозой национального масштаба на основании нескольких случаев заболевания в Форт-Дикс. Штамм свиного гриппа – известный в наши дни под названием A/New Jersey/76 – казался столь угрожающим отчасти потому, что быстро распространился по военной базе: в течение от двух до трех недель было диагностировано 230 подтвержденных случаев {526}. Это дало ученым основание предположить, что у болезни имеется крайне высокое репродуктивное число R0, близкое к 3, что было сопоставимо со значением R0 для пандемии «испанки» 1918 г.
Однако воинское подразделение можно считать средой, предрасположенной к заболеваниям. Солдаты находятся в нетипично тесном контакте друг с другом, в условиях, где им приходится делиться едой и постельными принадлежностями и сложно уединиться. Более того, они часто выполняют тяжелые физические упражнения, которые временно истощают иммунную систему, а социальные нормы в армии предполагают, что вы должны заниматься делом, даже если больны. Таким образом, для передачи инфекционного заболевания появляется множество возможностей, и оно начинает распространяться значительно быстрее.
Последующее изучение {527}событий в Форт-Дикс показало, что бурное распространение заболевания было вызвано этими особыми факторами, а не его вирулентностью. Форт-Дикс нельзя было считать аналогом какого-нибудь американского пригорода. Сам по себе штамм A/New Jersey/76 не был таким уж опасным. Значение R0 для него составляло всего 1,2, то есть было примерно таким же, как у обычного сезонного гриппа. Если бы дело происходило не на военной базе (или в другом месте с похожими условиями, типа тюрьмы или университетского общежития), то болезнь не распространилась бы так широко. В сущности, грипп в Форт-Дикс исчез сам по себе, после того как на базе не осталось инфицированных людей.
Фиаско, связанное с A/New Jersey/76, – как и парадокс в отношении ВИЧ/сифилиса в Сан-Франциско или всплески кори в Чикаго в 1980‑е гг. – способно многое сказать об ограничениях моделей, основанных на слишком упрощенных допущениях. Конечно же, я не хочу сказать, что вам всегда стоит предпочитать сложные модели простым; как мы уже видели в других главах этой книги, сложные модели так же успешно могут завести людей в тупик. А поскольку сложные модели часто дают нам более точные (хотя и не обязательно правильные) ответы, они способны слишком повысить самоуверенность исследователя и заставить его ошибочно считать себя отличным прогнозистом.
Тем не менее, хотя и можно считать плюсом модели ее простоту, она должна быть хотя бы изощренно простой {528}. Модели типа SIR, хотя и полезны для понимания болезни, слишком туповаты для того, чтобы помочь нам предсказать ее дальнейшее развитие.
Система имитационного моделирования Sim [99]в действии
Прогнозы погоды представляют собой один из немногих примеров сравнительно сложных моделей, в рамках которых качество предсказаний смогло значительно улучшиться. Для этого потребовались десятилетия работы, однако после создания системы, способной физически имитировать атмосферу, метеорологи получили возможность делать нечто большее, чем использовать исключительно статистические подходы к предсказаниям погоды.
Читать дальшеИнтервал:
Закладка: