Владимир Савельев - Статистика и котики

Тут можно читать онлайн Владимир Савельев - Статистика и котики - бесплатно ознакомительный отрывок. Жанр: Математика. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Владимир Савельев - Статистика и котики краткое содержание

Статистика и котики - описание и краткое содержание, автор Владимир Савельев, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Из этой книги вы узнаете, что такое дисперсия и стандартное отклонение, как найти t-критерий Стьюдента и U-критерий Манна-Уитни, для чего используются регрессионный и факторный анализы, а также многое и многое другое.
И все это — на простых и понятных примерах из жизни милых и пушистых котиков, которые дарят нам множество приятных эмоций.

Статистика и котики - читать онлайн бесплатно ознакомительный отрывок

Статистика и котики - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Владимир Савельев
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

2. Большое число наблюдений (от 30, но лучше более 100).

3. Распределение значений признаков приблизительно соответствует нормальному.

4. Отсутствуют выбросы (значения, на порядок отличающиеся от среднего).

Непараметрические меры различий работают и без этих допущений. Наиболее часто используемые меры различий представлены в таблице.

Пример: предположим, что вы выращиваете помидоры, и вам необходимо определить, какой из двух сортов демонстрирует лучшую урожайность. Чтобы это сделать, вам необходимо подсчитать количество помидоров при каждом кусте и занести эту информацию в таблицу. Дальше вы применяете к этим данным t-критерий Стьюдента и по нему судите о наличии различий между сортами. Если сортов больше двух, то ваш выбор — дисперсионный анализ с последующим сравнением с помощью специальных post-hoc-критериев.

МЕРЫ РАЗЛИЧИЙ ДЛЯ СВЯЗАННЫХ ВЫБОРОК

Позволяют определить различия между двумя связанными выборками. Также делятся на параметрические и непараметрические:

Пример: Представим, что вы преподаватель курсов повышения квалификации, и вам интересно узнать, вынесли ли ваши слушатели что-нибудь полезное с занятий. Чтобы это сделать, вам необходимо разработать некоторый проверочный тест и раздать его слушателям до начала занятий и после их окончания. T-критерий Вилкоксона позволит вам проверить, стали ли слушатели лучше знать ваш предмет. Если же вы провели несколько таких измерений, то ваш вариант — это критерий Фридмана.

МЕРЫ СВЯЗИ

Данный класс критериев (называемых также коэффициентами корреляции) позволяет найти взаимосвязь между переменными. Математически взаимосвязь — это совместное изменение переменных.

Если она положительна и равна 1, то увеличение значения первой переменной сопровождается увеличением значения второй. Если она отрицательна (-1), то высокое значение первой переменной сопровождается низким значением второй. Коэффициент корреляции, равный 0, обозначает отсутствие взаимосвязи.

Самыми популярными коэффициентами корреляции являются r Пирсона (параметрический) и p Спирмена (непараметрический).

Пример: вы решили провести психологическое исследование и выяснить, существует ли взаимосвязь между интеллектом и уровнем дохода. Для этого вам необходимо найти группу испытуемых, измерить их интеллект, узнать их среднемесячный доход и найти коэффициент корреляции. Если он высок и положителен, то более интеллектуальные люди получают больше денег.

Если вы получили подобный результат, необходимо быть очень внимательными при его интерпретации. Поскольку равновероятными могут быть следующие варианты.

Более умные люди получают работу с более высоким заработком.

Высокий доход позволяет больше времени уделять саморазвитию в целом и развитию интеллекта в частности.

Существует неизвестная переменная (фактор), обусловливающая эту взаимосвязь.

Взаимосвязь является случайным совпадением.

РЕГРЕССИОННЫЙ АНАЛИЗ

Данная группа методов позволяет построить функциональную математическую модель — уравнение, которое помогает предсказать значение некоторой целевой переменной, используя значения ряда переменных, называемых предикторами.

Наиболее распространенными методами регрессионного анализа являются линейная и логистическая регрессии. Линейная регрессия позволяет предсказать точное количественное значение некоторой переменной, представленной в метрической шкале. Логистическая регрессия позволяет предсказать вероятность принадлежности объекта к тому или иному классу.

Пример: предположим, вы управляете сетью розничных магазинов и хотите получить представление о том, какие факторы влияют на ежемесячную выручку в этих магазинах. Для этого вы должны замерить все возможные факторы, которые, по вашему мнению, могут на эту выручку повлиять: количество людей, посещающих магазин, число сотрудников на кассах, наличие на полках определенного товара и т. д. Затем необходимо построить линейную регрессию, указав в качестве целевой переменной выручку с этих магазинов, а в качестве предикторов — все, что вы замерили.

Получив регрессионную модель, вы сможете не только посмотреть, какие факторы влияют на продажи, но и предсказать, какую выручку будет получать магазин при определенных условиях.

Если вы немного скорректируете вашу задачу и примените метод логистической регрессии, то вы сможете узнать условия, при которых ваш магазин будет прибыльным или убыточным.

ДИСКРИМИНАНТНЫЙ АНАЛИЗ

Дискриминантный анализ во многом похож на логистическую регрессию. Задачу, которую он решает, можно приблизительно сформулировать так: по каким переменным я могу отнести конкретный объект в тот или иной класс.

Пример: предположим, вы проводите медицинское исследование и хотите узнать, по каким диагностическим показателям можно отличить больного человека от здорового. Для этого вы берете группы заведомо здоровых и больных людей и замеряете у них всех возможных «подозреваемых». После этого необходимо провести дискриминантный анализ, который и выявит систему показателей, по которым можно установить конкретный диагноз.

КЛАСТЕРНЫЙ АНАЛИЗ

Кластерный анализ позволяет разбить ваши объекты на классы. При этом число классов может быть заранее неизвестным, либо вы точно знаете их количество. В первом случае ваш выбор — это метод иерархической кластеризации, который последовательно объединяет объекты в группы, основываясь на расстоянии между ними. Для второго случая необходим метод k-средних, который группирует ваши объекты вокруг так называемых центроидов.

Пример: представим себе, что вы занимаетесь онлайн-продажами, и вам необходимо выделить категории клиентов, для того чтобы организовать более эффективную таргетированную рекламу. Чтобы это сделать, вы можете запустить на своем сайте небольшой опросник и, собрав некоторые данные о посещаемости тех или иных страниц, провести кластерный анализ. Если у вас есть некоторые предположения о том, какие именно категории клиентов заходят к вам на сайт, ваш выбор k-средних. Если таких предположений нет — то можно обойтись иерархической кластеризацией.

ФАКТОРНЫЙ АНАЛИЗ

Факторный анализ позволяет сократить количество переменных, заменив их набором факторов. Кроме того, он может являться предварительной процедурой перед проведением регрессионного анализа в случае, если ряд предикторов коррелирует между собой.

Пример: предположим, вы разрабатываете батарею психологических тестов, предназначенную для диагностики способностей у школьников. После того, как вы составили ряд задач, а также провели их на выборке учащихся, вам необходимо будет провести факторный анализ. Если высокий балл по одной задаче, как правило, сопровождается высоким баллом по другой задаче, значит, за ними скорее всего стоит некоторый общий фактор. Этот фактор и будет указывать на уровень развития той или иной способности.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Владимир Савельев читать все книги автора по порядку

Владимир Савельев - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Статистика и котики отзывы


Отзывы читателей о книге Статистика и котики, автор: Владимир Савельев. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x