Владимир Савельев - Статистика и котики

Тут можно читать онлайн Владимир Савельев - Статистика и котики - бесплатно ознакомительный отрывок. Жанр: Математика. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Владимир Савельев - Статистика и котики краткое содержание

Статистика и котики - описание и краткое содержание, автор Владимир Савельев, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Из этой книги вы узнаете, что такое дисперсия и стандартное отклонение, как найти t-критерий Стьюдента и U-критерий Манна-Уитни, для чего используются регрессионный и факторный анализы, а также многое и многое другое.
И все это — на простых и понятных примерах из жизни милых и пушистых котиков, которые дарят нам множество приятных эмоций.

Статистика и котики - читать онлайн бесплатно ознакомительный отрывок

Статистика и котики - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Владимир Савельев
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Второй способ называется методом каменистой осыпи (или критерием Кеттелла ). Для того чтобы им воспользоваться, необходимо построить график собственных значений. На горизонтальной оси этого графика располагаются факторы, а на вертикальной — их собственные значения. На определенной точке этого графика происходит перегиб. И все факторы, которые находятся за этой точкой, отсеиваются.

И наконец последний шаг — это придумать название получившимся факторам. Этот шаг является довольно нетривиальным — подчас он вызывает наибольшие затруднения. Но если вы успешно преодолеете его, то у вас на руках может оказаться довольно неплохая структурная модель котикового характера. В нашем случае первый фактор будет называться «жизнерадостностью», а второй — «царапучестью».

НЕМАЛОВАЖНО ЗНАТЬ!

Применение факторного анализа

Изначально факторный анализ был разработан психологами для изучения способностей и личностных качеств. Однако со временем область применения данного метода существенно расширилась.

Первая большая проблема, которую позволяет решить факторный анализ, это сокращение количества переменных. Как правило, серьезные исследования подразумевают сбор большого количества данных. Настолько большого, что в них бывает очень трудно разобраться. В этом случае факторный анализ позволяет уменьшить их количество за счет замены изначальных переменных факторами.

Вторая задача, требующая применения факторного анализа, это устранение мультиколлинеарности из регрессионных моделей. Напомним, что эта проблема заключается в том, что если две или более переменные взаимосвязаны между собой, результаты регрессионного анализа будут крайне ненадежными. Поэтому такие переменные требуется удалить из анализа. И один из путей — это замена таких переменных факторами.

Заключение

Ну вот и все. Ну, может, конечно, и не все: статистика все-таки гораздо богаче, и многое осталось за бортом. Но пока все. Потому что если объяснять совсем все, то пропадает интерес. А интерес — движущая сила в познании любого предмета. Да и потом, совсем все не объяснишь.

А так, мы рассмотрели самые базовые методы, которыми пользуются статистики для анализа данных. Мы прошлись по описательной статистике, рассмотрели меры различий и меры связи, познакомились с регрессионным и дискриминантным анализами, а также разобрались, как работают методы кластеризации и для чего используется факторный анализ. В общем, немало.

Надеюсь, что статистика стала вам ближе. Надеюсь, что страх и недоверие, если они и были, то прошли. Надеюсь, что вы заметили ту внутреннюю красоту, которая присуща этой дисциплине.

А в общем, надеюсь, что вам понравилось.

С уважением

Савельев Владимир

Приложение 1. Коротко о главном

В данном разделе кратко представлены методы, рассмотренные в книге, а также примеры их применения на практике. На этот раз без картинок и почти без котиков.

ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ, НЕОБХОДИМЫЕ ДЛЯ ПОНИМАНИЯ МАТЕРИАЛА

Генеральная совокупность — группа объектов, которые вам интересны как исследователю. В книге — все котики как биологический вид.

Выборка — часть генеральной совокупности, доступная для исследования. Статистики стремятся к тому, чтобы результаты, полученные на выборках, были верны и для генеральной совокупности. В книге описывается как котики, которых мы непосредственно измеряем.

Связанные выборки — ситуация, при которой любому объекту из первой выборки соответствует ровно один объект из второй. Можно сказать, что они образуют неразрывную пару (а в более сложных случаях — тройку, четверку и т. д.). В книге — котики до и котики после приема лекарства.

Наблюдение — измеренный объект. Котик.

Переменные — свойства объектов, которые поддаются измерению. В книге — котиковое счастье, здоровье, размер и т. д.

Значение переменной — степень выраженности того или иного свойства у конкретного объекта. Иными словами — насколько данный котик здоров, сыт и счастлив.

МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ

Используются, когда вам нужно отразить наиболее типичные значения, присутствующие в вашей выборке.

Состав:

1. Мода — наиболее часто встречающееся значение.

2. Медиана — середина упорядоченного ряда значений.

3. Среднее арифметическое — сумма значений, деленная на их количество.

Пример: определение наиболее типичной зарплаты в нашей стране можно осуществлять по двум показателям — среднему арифметическому и медиане. Первая определяется как количество денег, деленное на количество людей, а второе — как зарплата человека, стоящего ровно посередине между самым бедным и самым богатым. Как правило, эти значения различаются — средняя зарплата выше медианной. И чем это различие больше, тем выше социальное неравенство в обществе.

МЕРЫ ИЗМЕНЧИВОСТИ

Используются, когда нужно отразить степень разброса значений относительно меры центральной тенденции.

Состав:

1. Размах — разность между максимальным и минимальным значениями.

2. Дисперсия — сумма квадратов отклонений, деленная на их количество. Отклонение — это разность между средним арифметическим и конкретным значением. Дисперсии для генеральной совокупности и для выборки вычисляются по разным формулам.

3. Стандартное отклонение — корень из дисперсии.

Пример: предположим, вы владеете заводом, который выпускает гвозди. Для любого массового производства необходимо, чтобы изделия полностью соответствовали некоторому стандарту. Например — длина ваших гвоздей должна быть ровно 10 см. Однако на практике всегда существуют некоторые отклонения от этого стандарта (например 10,2 или 9,7 см). Меры изменчивости позволяют оценить величину этих отклонений. Если стандартное отклонение длины превышает некоторое критическое значение, то ваша продукция не соответствует стандарту, а следовательно — не является качественной.

МЕРЫ РАЗЛИЧИЙ ДЛЯ НЕСВЯЗАННЫХ ВЫБОРОК

Позволяют определить различия между двумя несвязанными выборками. Наличие значимых различий по определенному признаку позволяет с некоторой уверенностью говорить о том, что генеральные совокупности также различаются. Эти методы делятся на параметрические и непараметрические. Первые желательно использовать только тогда, когда ваши данные удовлетворяют следующим требованиям.

1. Данные представлены в метрической шкале. Иными словами, признаки должны быть представлены в определенных единицах измерения (см, кг, сек. и т. д.)

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Владимир Савельев читать все книги автора по порядку

Владимир Савельев - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Статистика и котики отзывы


Отзывы читателей о книге Статистика и котики, автор: Владимир Савельев. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x