Нейт Сильвер - Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет
- Название:Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет
- Автор:
- Жанр:
- Издательство:Array Литагент «Аттикус»
- Год:2015
- Город:Москва
- ISBN:978-5-389-09938-8
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Нейт Сильвер - Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет краткое содержание
О том, как этому научиться, рассказывает Нейт Сильвер, политический визионер и гуру статистики, разработавший систему прогнозов, позволившую дважды максимально точно предсказать результаты президентских выборов почти во всех штатах Америки. Его книга во многом близка исследованиям Нассима Талеба и столь же значима для всех, кто имеет дело с большими объемами данных и просчитывает различные варианты развития событий. И если Талеб говорит о законах зарождения «черных лебедей», Сильвер исследует модели и способы, позволяющие поймать этих птиц в расставленные нами сети. Он обобщает опыт экспертов-практиков, изучает различные модели и подходы, позволяющие делать более точные прогнозы. Как и Даниэль Канеман, автор бестселлера «Думай медленно… Решай быстро», наблюдая за поведением и мышлением людей, оценивающих неопределенные события, Сильвер утверждает: да, компьютеры незаменимы при работе с огромными массивами данных, но для максимальной точности результатов необходим гибкий человеческий ум и опыт, ведь прогнозирование – это планирование в условиях неопределенности.
Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Берегитесь – кривая старения!
Однако все, о чем шла речь выше, основывалось на предположении, что способности игрока не меняются год от года – и если бы мы только могли отделить сигнал от шума, то узнали бы все, что нам нужно. Но в реальной жизни навыки бейсболиста постоянно изменяются, и в этом кроется немалая проблема.
Изучив статистику по нескольким тысячам игроков, Джеймс обнаружил, что игра типичного из них {198}год от года совершенствуется до тех пор, пока его возраст не приблизится к отметке примерно в 30 лет, а начиная примерно с этого возраста навыки обычно начинают атрофироваться, что особенно заметно проявляется примерно к 35 годам {199}. И этот факт позволил Джеймсу сделать одно из самых значительных своих открытий – выявить кривую старения .
Гимнастки-олимпийки достигают пика своей карьеры в подростковом возрасте, поэты – после 30 лет; шахматисты – после 30 {200}; экономисты – после 40 {201}, а средний возраст CEO компаний из списка Fortune 500 равен 55 годам {202}. Игрок в бейсбол, как обнаружил Джеймс, достигает своего спортивного пика в возрасте 27 лет. У 60 % игроков из списка, включающего 50 самых известных бейсболистов, отмеченных наградами в период между 1985 и 2009 гг., возраст колебался в интервале между 25 и 29 годами, а возраст 20 % из них составлял ровно 27 лет. Именно в этом возрасте, судя по всему, возникает идеальное соотношение между физической и умственной формой, необходимой для игры (рис. 3.1).

Рис. 3.1.Кривая старения для подающего
Осознание этого факта – существование кривой старения – могло бы стать невероятно ценным для любой команды, ознакомившейся с работой Джеймса. В соответствии с принятыми правилами бейсболист не может стать профессиональным игроком, не связанным контрактом, до достаточно поздних этапов своей карьеры. Он получает право на этот статус, отыграв не менее шести полных сезонов в основной лиге (до этого момента он находится под полным контролем своего первого клуба и не может требовать у него полной оплаты по рыночным ставкам).
Поскольку типичный новичок оказывается в крупных лигах в возрасте 23 или 24 лет, он не может стать свободным игроком до 30-летнего возраста – то есть до того периода, когда пик его результативности уже минует. Команды платили многим профессиональным игрокам большие суммы в расчете на то, что они смогут оставаться столь же производительными, что и в возрасте до 30 лет; в реальности же их результаты обычно ухудшались, а поскольку контракты в главной бейсбольной лиге имеют определенные гарантии, у команды были связаны руки.
Однако кривая старения Джеймса рисовала слишком гладкую картину. Разумеется, средний игрок достигает пика в возрасте 27 лет. Но, как скажет вам любой человек, внимательно изучавший в детстве обратные стороны бейсбольных карточек, игроки стареют с разной скоростью. Боб Хорнер, третий бейсмен команды Atlanta Braves в 1980‑е гг., получил награду «Новичок года» в возрасте 20 лет и вошел в команду «Всех звезд», когда ему было 24 года; в то время многие считали, что он точно попадет в Зал бейсбольной славы. Однако к 30 годам, вследствие череды травм и неудачного перехода в команду Yakult Swallows японской лиги, он полностью покинул мир профессионального бейсбола. С другой стороны, великий Эдгар Мартинез из Seattle Mariners не имел постоянного контракта в крупных лигах до 27 лет. Однако ему все равно удалось пережить период расцвета своей спортивной карьеры, хотя и достаточно поздно – после 30 лет: и даже в 40 лет он возглавлял список лиги по количеству RBI [43].
Хотя случаи с Хорнером и Мартинезом и могут считаться исключением из правила, крайне редко уровень игры других бейсболистов изменяется в точном соответствии с гладкой траекторией кривой старения; скорее, нормой для них оказывается периодически нарушаемое равновесие взлетов и падений.
Реальные кривые старения наполнены шумом – причем значительным (рис. 3.2). В среднем они могут выглядеть довольно гладкими. Однако среднее подобно семье, имеющей 1,7 ребенка, – это всего лишь статистическая абстракция. Возможно, полагал Гэри Хакебей, в шуме есть сигнал, который не учитывала кривая Джеймса. Возможно, у игроков на сложных с точки зрения физических сил позициях навыки пропадают быстрее, чем у других. А возможно, карьера игроков, обладающих более атлетическим сложением, продолжительнее, чем у игроков, имеющих лишь один-два сильно развитых навыка.

Рис. 3.2.Вид кривых старения, на которых отражаются шумы, для различных подающих
На основе системы Хакебея была выдвинута гипотеза, согласно которой имеется 26 различных видов кривых старения, причем каждый из них применим к разным типам игроков {203}. Если Хакебей был прав, то появлялась возможность оценить, какая кривая в большей степени подходит для каждого игрока, и тем самым предсказать, как будет развиваться его карьера. Если кривая старения игрока была похожа на соответствующую кривую Боба Хорнера, то можно было бы ожидать, что пик его карьеры придется на более ранний возраст, а затем наступит раннее угасание. Если же его кривая больше напоминала кривую Мартинеза, то лучшие сезоны этого бейсболиста наступят в более зрелом возрасте.
Хотя системе Vladimir Хакебея и удалось сделать ряд правильных прогнозов, в целом она все же была ненамного более точной, чем медленные и устойчивые прогнозы Джеймса {204}, согласно которым одна и та же кривая старения применялась к каждому игроку. Отчасти проблема заключалась в том, что число 26 для количества категорий Хакебея было выбрано случайным образом, а для того, чтобы определить, к какой группе относится игрок, требовалось скорее искусство, а не наука.
Но, чтобы войти в число элитных игроков в бейсбол, человек должен обладать широким диапазоном физических и ментальных навыков: мышечной памятью, физической силой, координацией между глазами и руками, скоростью удара битой, распознаванием направления полета мяча и силой воли, позволяющей сохранять концентрацию даже в сложные для команды периоды. Понятие о существовании различных видов кривых старения, вытекающее из созданных системой Vladimir, казалось, более точно отражало всю сложность, присущую человеческой природе.
При разработке PECOTA я попытался заимствовать некоторые элементы у Хакебея, а некоторые – у Билла Джеймса. В выпуске Baseball Abstract за 1986 г. Джеймс представил так называемые оценки подобия, которые (как и предполагает их название) были призваны выявить статистическое подобие между статистикой карьеры любых двух игроков основной лиги. Концепция была сравнительно простой. Для начала каждому из двух игроков присваивалось по 1000 баллов, а затем при наличии между игроками различий по тому или иному параметру соответствующие баллы вычитались {205}. У игроков с высокой степенью подобия итоговый балл мог составлять 950 или даже 975, однако в других случаях расхождения накапливались достаточно быстро.
Читать дальшеИнтервал:
Закладка: