Дэвид Шпигельхалтер - Искусство статистики. Как находить ответы в данных
- Название:Искусство статистики. Как находить ответы в данных
- Автор:
- Жанр:
- Издательство:Манн, Иванов и Фербер
- Год:2021
- Город:Москва
- ISBN:9785001692508
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Дэвид Шпигельхалтер - Искусство статистики. Как находить ответы в данных краткое содержание
Эта книга предназначена как для студентов, которые хотят ознакомиться со статистикой, не углубляясь в технические детали, так и для широкого круга читателей, интересующихся статистикой, с которой они сталкиваются на работе и в повседневной жизни. Но даже опытные аналитики найдут в книге интересные примеры и новые знания для своей практики. На русском языке публикуется впервые.
Искусство статистики. Как находить ответы в данных - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
нулевая гипотеза:принимаемое по умолчанию теоретическое предположение, как правило, означающее отсутствие эффекта или результата, проверяемое с помощью P-значения. Обычно обозначается H 0;
обратная причинная зависимость:когда связь между двумя переменными изначально кажется причинно-следственной, а на деле причинно-следственные отношения оказываются обратными. Например, у людей, которые не употребляют алкоголь, показатели здоровья хуже, чем у умеренно пьющих, однако как минимум частично это объясняется тем, что некоторые ныне непьющие бросили пить из-за ухудшения здоровья;
обучение без учителя:определение классов на основании случаев без подтвержденного состава с использованием какой-либо формы процедуры кластеризации;
обучение с учителем:построение алгоритма классификации на основании случаев с подтвержденным составом классов;
объективное априорное распределение:попытка устранить субъективный компонент в байесовском анализе, заранее определив априорные распределения, которые должны отражать наше незнание параметров, а данные должны говорить за себя. Нет никакой общей процедуры для определения таких априорных распределений;
односторонние и двусторонние P-значения:значения, соответствующие односторонним и двусторонним критериям;
односторонние и двусторонние критерии:односторонний критерий для проверки гипотезы используется тогда, когда нулевая гипотеза, например, указывает, что эффект медицинского вмешательства отрицателен. Эта гипотеза отвергается только в случае, если наблюдаются большие положительные значения тестовой статистики, выражающие оценку эффекта вмешательства. Двусторонний критерий уместен, когда нулевая гипотеза говорит, что эффект медицинского вмешательства равен в точности нулю. Тогда к отказу от такой гипотезы ведут и большие положительные, и большие отрицательные значения тестовой статистики;
ожидаемые частоты:количество событий, которые должны произойти в будущем в соответствии с принятой вероятностной моделью;
остаток:разность между наблюдаемым значением и значением, предсказываемым статистической моделью;
относительный риск:если в группе людей, подвергавшихся какому-то воздействию, абсолютный риск равен p , а в группе людей, не подвергавшихся этому воздействию, абсолютный риск равен q , то относительный риск определяется как p / q ;
отношение показателей:относительное увеличение ожидаемого числа событий за определенный период времени, связанное с каким-либо воздействием. Пуассоновская регрессия – это форма множественной регрессии, когда переменная отклика представляет собой наблюдаемый показатель, а коэффициенты соответствуют log(отношение показателей);
отношение правдоподобия:мера относительного подтверждения, которое дают данные для двух конкурирующих гипотез. Для гипотез H 0и H 1отношение правдоподобия при данных x определяется формулой p ( x | H 0) / p ( x | H 1);
отношение рисков:при анализе времени выживания – связанный с воздействием относительный риск пережить какое-то событие за определенный промежуток времени. Регрессия Кокса – это форма множественной регрессии, когда переменная отклика – это время выживания, а коэффициенты соответствуют log(отношение рисков);
ошибка второго рода:происходит, когда альтернативная гипотеза верна, но после проверки нулевая гипотеза не отвергается, то есть делается ложноотрицательное утверждение;
ошибка первого рода:происходит, когда ошибочно отклоняется верная нулевая гипотеза в пользу альтернативы, то есть делается ложноположительное утверждение;
ошибка прокурора:когда малая вероятность факта при условии невиновности ошибочно истолковывается как вероятность невиновности при условии наличия данного факта;
параметры:неизвестные величины в статистической модели, обычно обозначаемые греческими буквами;
перекрестная проверка:способ оценивания качества алгоритма для прогноза или классификации путем нескольких выделений части случаев в качестве тестового набора;
переобучение (переподгонка):построение статистической модели, которая чрезмерно адаптирована к тренировочному набору данных, из-за чего ее прогнозные возможности начинают ухудшаться;
пиктографические диаграммы:графическое отображение величин с помощью небольших изображений, например изображений людей;
Пирсона коэффициент корреляции:если у нас есть n пар чисел ( x 1, y 1),( x 2, y 2)…( x n,y n ) и , s x – это выборочное среднее и среднеквадратичное отклонение для чисел x , а
, s y – это выборочное среднее и среднеквадратичное отклонение для чисел y , то коэффициент корреляции Пирсона определяется формулой

Предположим, что x и y стандартизованы до Z-оценок u и v соответственно, то есть , а
. Тогда коэффициент корреляции Пирсона можно выразить как
, то есть прямого произведения Z-оценок;
плацебо:пустое вещество (например, таблетка с сахаром), которое дают контрольной группе в рандомизированном клиническом испытании под видом реального лечения;
погрешность:правдоподобный промежуток, в котором может лежать истинная характеристика популяции. Часто используются 95-процентные доверительные интервалы, которые примерно заключают промежуток ±2 стандартных ошибки, но иногда используются «усы» (планки погрешностей), отображающие ±1 стандартную ошибку;
подтверждающие исследования и анализы:строгие исследования, в идеале выполняющиеся с заранее утвержденным протоколом в целях подтверждения или опровержения гипотез, выдвинутых в ходе «поисковых» исследований или анализов;
поисковые исследования и анализы:первоначальные гибкие исследования, которые допускают адаптивные изменения в планах и анализе в целях поиска многообещающих результатов и предназначены для того, чтобы генерировать гипотезы, которые будут проверяться последующими подтверждающими исследованиями;
Читать дальшеИнтервал:
Закладка: