Дэвид Шпигельхалтер - Искусство статистики. Как находить ответы в данных
- Название:Искусство статистики. Как находить ответы в данных
- Автор:
- Жанр:
- Издательство:Манн, Иванов и Фербер
- Год:2021
- Город:Москва
- ISBN:9785001692508
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Дэвид Шпигельхалтер - Искусство статистики. Как находить ответы в данных краткое содержание
Эта книга предназначена как для студентов, которые хотят ознакомиться со статистикой, не углубляясь в технические детали, так и для широкого круга читателей, интересующихся статистикой, с которой они сталкиваются на работе и в повседневной жизни. Но даже опытные аналитики найдут в книге интересные примеры и новые знания для своей практики. На русском языке публикуется впервые.
Искусство статистики. Как находить ответы в данных - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
215
Некоторые даже могут заявить, что это была идеологическая обработка.
216
Еще раз подчеркнем, что 1/5 – это не вероятность, поэтому запись 1/5 двусмысленна и лучше писать 1 к 5 или хотя бы 1:5. В русском языке слово «шансы» имеет два значения. Во-первых, оно часто синонимично слову «вероятность» (мы скажем, что вероятность выпадения шестерки равна 1/6 и шансы на выпадение шестерки равны 1/6). Во-вторых, мы можем сказать, что шансы на выпадение шестерки 1:5 (1 к 5). Именно в этом смысле употребляет термин автор. Прим. пер.
217
В нашей литературе теорема Байеса обычно формулируется на языке вероятностей, а не шансов. Прим. пер.
218
Лат. a prioi «от предшествующего», a posteriori «от последующего». Априорные знания получены заранее, до опыта, апостериорные – после опыта. Теорема Байеса дает возможность пересчитать априорные вероятности гипотез в апостериорные, поскольку произошедшие события их изменили. Прим. пер.
219
T. E. King et al., ‘Identification of the Remains of King Richard III’, Nature Communications 5 (2014) 5631.
220
Указания по отношениям правдоподобия: http://enfsi.eu/wp-content/uploads/2016/09/m1_guideline.pdf.
221
Статья об использовании байесовской теории в суде: ‘A Formula for Justice’, The Guardian, 2 October 2011.
222
В покере – туз, король, дама, валет и десятка одной масти. Прим. пер.
223
Автор ошибается. Вероятность получить роял-флеш составляет . Видимо, подразумевается стрит-флеш (пять карт одной масти, идущие подряд): вероятность такой комбинации действительно близка к 1 / 72 000 (точнее, примерно 1 / 72 193). Прим. пер.
224
Архиепископ Кентерберийский – глава государственной Церкви Англии. Прим. пер.
225
Его точные слова: «Дано количество раз, когда неизвестное событие случилось и не случилось: требуются шансы на то, что вероятность его появления в одном испытании лежит между любыми двумя степенями вероятности, которые можно указать». В целом тут все довольно понятно, за исключением того, что в современной терминологии мы поменяли бы слова «шансы» и «вероятность».
226
Будучи пресвитерианским священником, он называл его просто «стол».
227
Формула для такого распределения – 60 p 2(1− p ) 3, то есть частный случай бета-распределения – B(3,4). Если считать априорное распределение равномерным, то апостериорное распределение для положения белого шара, при условии, что бросили n красных шаров, из которых r оказались левее белого, задается формулой ,
то есть это бета-распределение B( r + 1, n – r + 1).
228
Интуиция не должна давать 2/5. Бросим на стол всего один красный шар. Если вам сказали, что он слева, то доля красных шаров слева от белого равна 1 / 1 = 1, но вряд ли ваша интуиция согласится, что среднее положение белого шара равно 1, то есть он лежит у правого края стола. Прим. пер.
229
Онлайн-панель – это группа людей, которые согласились участвовать в онлайн-исследованиях. Они регистрируются на каком-либо сайте и регулярно предоставляют информацию о себе. Прим. пер.
230
В английском языке есть пословица «Нельзя сделать шелковый кошелек из свиного уха». Прим. пер.
231
Подвешенный парламент – парламент, в котором ни одна из партий не имеет большинства. Прим. пер.
232
D. K. Park, A. Gelman and J. Bafumi, ‘Bayesian Multilevel Estimation with Poststratification: State-Level Estimates from National Polls’, Political Analysis 12 (2004), 375–85; Результаты опросов YouGov взяты с сайта: https://yougov.co.uk/news/2017/06/14/how-we-correctly-called-hung-parliament/.
233
K. Friston, ‘The History of the Future of the Bayesian Brain’, Neuroimage 62:2 (2012), 1230–33.
234
N. Polson and J. Scott, AIQ: How Artificial Intelligence Works and How We Can Harness Its Power for a Better World (Penguin, 2018), p. 000.
235
R. E. Kass and A. E. Raftery, ‘Bayes Factors’, Journal of the American Statistical Association 90 (1995), 773–95.
236
Напоминаем, что это означает, что при многократном повторении 95 % таких интервалов будут включать истинное значение, но мы ничего не можем сказать о каком-то конкретном интервале.
237
J. Cornfield, ‘Sequential Trials, Sequential Analysis and the Likelihood Principle’, American Statistician 20 (1966), 18–23.
238
И тем не менее я по-прежнему предпочитаю байесовский подход.
239
Проект в 2011 году запустил Брайан Нозек из Виргинского университета. Он и его коллеги взялись проверить 100 исследований, выполненных в 2008 году, результаты которых были опубликованы в трех психологических журналах. Они старались максимально придерживаться условий оригинальных экспериментов и даже консультировались с их авторами. Результаты проекта были опубликованы в 2015 году. Прим. пер.
240
Open Science Collaboration, ‘Estimating the Reproducibility of Psychological Science’, Science 349:6251 (28 August 2015), aac4716.
241
A. Gelman and H. Stern, ‘The Difference Between “Significant” and “Not Significant” Is Not Itself Statistically Significant’, American Statistician 60:4 (November 2006), 328–31.
242
Падение началось вскоре после запуска Facebook, но данные не могут сказать нам, что это – корреляция или причинно-следственная связь.
243
Ronald Fisher, Presidential Address to the first Indian Statistical Congress, 1938, Sankhyā 4(1938), 14–17.
244
В английском языке термин post mortem (патологоанатомическое вскрытие трупа) имеет переносное значение «разбор действий», «обсуждение причин неудачи», «итоговый анализ». Прим. пер.
245
См. ‘The Reinhart and Rogoff Controversy: A Summing Up’, New Yorker, 26 April 2013.
246
Эта ошибка в сочетании с другими критическими замечаниями, как утверждается, повлияла на выводы в исследовании, однако это активно оспаривается авторами.
247
‘AXA Rosenberg Finds Coding Error in Risk Program’, Reuters, 24 April 2010.
248
История с Харконеном изложена в статье: ‘The Press-Release Conviction of a Biotech CEO and its Impact on Scientific Research’, Washington Post, 13 September 2013.
249
D. Fanelli, ‘How Many Scientists Fabricate and Falsify Research? A Systematic Review and Meta-Analysis of Survey Data’, PLOS ONE 4:5 (29 May 2009), e5738.
250
U. Simonsohn, ‘Just Post It: The Lesson from Two Cases of Fabricated Data Detected by Statistics Alone’, Psychological Science 24:10 (October 2013), 1875–88.
251
P-хакинг (P-hacking) – это изменение результатов исследований с целью добиться нужного P-значения. Такая практика манипулирования данными служит для того, чтобы показать статистические значения, подтверждающие желаемый результат, который обычно в чем-то выгоден либо исследователям, либо спонсорам. Прим. ред.
252
J. P. Simmons, L. D. Nelson and U. Simonsohn, ‘False-Positive Psychology: Undisclosed Flexibility in Data Collection and Analysis Allows Presenting Anything as Significant’, Psychological Science 22:11 (November 2011), 1359–66.
Читать дальшеИнтервал:
Закладка: