Нейт Сильвер - Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет
- Название:Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет
- Автор:
- Жанр:
- Издательство:Array Литагент «Аттикус»
- Год:2015
- Город:Москва
- ISBN:978-5-389-09938-8
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Нейт Сильвер - Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет краткое содержание
О том, как этому научиться, рассказывает Нейт Сильвер, политический визионер и гуру статистики, разработавший систему прогнозов, позволившую дважды максимально точно предсказать результаты президентских выборов почти во всех штатах Америки. Его книга во многом близка исследованиям Нассима Талеба и столь же значима для всех, кто имеет дело с большими объемами данных и просчитывает различные варианты развития событий. И если Талеб говорит о законах зарождения «черных лебедей», Сильвер исследует модели и способы, позволяющие поймать этих птиц в расставленные нами сети. Он обобщает опыт экспертов-практиков, изучает различные модели и подходы, позволяющие делать более точные прогнозы. Как и Даниэль Канеман, автор бестселлера «Думай медленно… Решай быстро», наблюдая за поведением и мышлением людей, оценивающих неопределенные события, Сильвер утверждает: да, компьютеры незаменимы при работе с огромными массивами данных, но для максимальной точности результатов необходим гибкий человеческий ум и опыт, ведь прогнозирование – это планирование в условиях неопределенности.
Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
77
Стоит вспомнить, что шкала магнитуды уже является логарифмической, поэтому с технической точки зрения это двойная логарифмическая шкала. – Прим. авт.
78
Оверфиттинг ( англ . overfitting – сверхточность или сверхподгонка) – в математике так называют явление, когда при построении алгоритма классификации получается алгоритм, который слишком хорошо работает на тестовых примерах, но плохо работает вообще; в статистике так называют статистическую модель, которая слишком хорошо работает на одном массиве данных и плохо на других, в то время как она должна описывать общие закономерности для всех массивов.
79
Математическая индукция – один из методов математического доказательства. Индукцией называют переход от частных утверждений к общим.
80
Если вы введете в компьютер случайную последовательность единиц и нулей, обозначающих орлы и решки при бросании монетки, а затем проведете тестирование статистических параметров для выявления закономерностей и построения модели, то в какой-то момент вам может показаться, что вы способны предсказать 60–70 % или даже 100 % результатов бросков (при включении достаточного количества переменных). Разумеется, это ошибка. В долгосрочной перспективе модель позволит предсказывать ровно 50 % бросков монеты, не больше и не меньше. – Прим. авт .
81
Имеется в виду книга Н. Н. Талеба «Одураченные случайностью» (Fooled by Randomness: The Hidden Role of Chance in Life and in the Markets) о том, как случайные события многие ошибочно считают или преподносят как закономерность или умение. Эту книгу журнал Fortune назвал одной из 75 самых умных книг всех времен.
82
Об этой истории мне рассказал политолог Роджер Пильке-мл., приглашенный городской администрацией для консультаций после случившегося бедствия. – Прим. авт .
83
Интервал предсказаний в 95 % – стандарт, используемый в политических опросах, – оказывается еще больше – 9,1 процентного пункта, что соответствует пределу погрешности ±4,6 пункта. – Прим. авт.
84
Самые значительные переменные разбиваются примерно на дюжину основных категорий: рост (измеряемый ВВП и его компонентами), занятость, инфляция, процентные ставки, уровни зарплат и доходов, доверие потребителей, промышленное производство, объемы продаж и уровни потребительских расходов, цены на активы (такие, как акции и дома), потребительские цены (например, фьючерсы на нефть), а также показатели финансовой политики и государственных расходов. Как вы видите, здесь есть с чем работать, поэтому обращаться к 400 другим показателям вряд ли имеет особый смысл. – Прим. авт .
85
Закон Оукена – статистическая закономерность, согласно которой увеличение уровня безработицы на 1 % соответствует падению отношения фактического валового национального продукта (ВНП) к потенциально возможному ВНП на 3 %. Обнаружена А. Оукеном на основе анализа данных ВНП в 1950‑х гг. для США; подтверждается статистикой 60‑х, 70‑х и 80‑х гг.
86
Цикл деловой активности – периодические колебания уровня деловой активности в экономике страны, в которых принято выделять четыре фазы: подъем, бум, спад и депрессию.
87
Отчасти это может быть связано с неполными экономическими данными за период до Второй мировой войны. – Прим. авт .
88
Федеральный комитет по операциям на открытом рынке (Комитет Федеральной резервной системы по операциям на открытом рынке) – орган, ответственный за выработку политики ФРС в области покупки и продажи ценных бумаг на открытом рынке с целью воздействия на величину денежного предложения, состоит из членов Совета управляющих ФРС, президента Федерального резервного банка Нью-Йорка и президентов четырех других федеральных резервных банков.
89
«Медвежий», то есть снижающийся (так говорят о рынке, на котором наблюдается снижение цен, или о факторах, которые способствуют снижению цен).
90
Среднеквадратическая ошибка для прогнозов в эти годы составляла 1,1 пункта ВВП, в отличие от 2,3 пункта за 1968–1985 гг. – Прим. авт .
91
Форт-Дикс находится в 27 км к юго-востоку от Трентона, штат Нью-Джерси; учебный центр пехоты перед отправкой на службу за границу.
92
В качестве примера противоположной ситуации можно привести Индию, где значительная часть населения относится к вегетарианцам или мусульманам – двум группам, не потребляющим свинину ни в каком виде (даже в США или Великобритании вы вряд ли найдете свинину в меню настоящего индийского ресторана). Хотя Индия соответствует двум другим условиям, она редко бывает источником гриппа. – Прим. авт.
93
Если бы мы предположили, что население мира должно было увеличиваться на 2,1 % в год, и взяли за точку отсчета 1968 г., когда Эрлих опубликовал свою книгу, то к 2012 г. количество жителей планеты должно было бы составить почти 9 млрд что значительно выше реального значения в 7 млрд. – Прим. авт.
94
Медианным, или срединным, значением (Ме) называют такое значение случайной величины, при котором половина результатов имеет меньшее, а другая – большее значение, чем Me.
95
Например, в Нью-Йорке (в отличие от Сан-Франциско) не разрешается подавать заявление в полицию через Сеть. Я обнаружил это, когда в арендованную мной для поездки машину влезли воришки. Сан-Франциско удается лучше информировать горожан и туристов о преступлениях и их предотвращении. При этом такой метод работы приводит к повышению количества зарегистрированных преступлений. – Прим. авт.
96
Обычно вакцина содержит небольшой и очень слабый микроорганизм, извлеченный из субстанции, заражение которой вы хотите предотвратить. Как правило, этого количества бывает достаточно для того, чтобы ваш организм выработал достаточный иммунитет без заболевания. – Прим. авт.
97
В компартментальных моделях исследуемая система представляется в виде совокупности компартментов, потоков вещества между ними, а также источников и стоков всех веществ. Компартмент – это некоторое количество вещества, выделяемое в биологической системе и обладающее свойством единства.
98
Американская система академических степеней насчитывает три основные градации: бакалавр (BSc), магистр (MSc) и доктор (PhD – philosophy doctor).
99
Sim (СИМ) – комплекс программных средств для создания имитационной модели и ее симуляции (имитации).
100
Агентное моделирование (agent-based model (ABM)) – метод имитационного моделирования, исследующий поведение децентрализованных агентов и то, как такое поведение определяет поведение всей системы в целом.
Читать дальшеИнтервал:
Закладка: