Владимир Савельев - Статистика и котики

Тут можно читать онлайн Владимир Савельев - Статистика и котики - бесплатно ознакомительный отрывок. Жанр: Математика. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Владимир Савельев - Статистика и котики краткое содержание

Статистика и котики - описание и краткое содержание, автор Владимир Савельев, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Из этой книги вы узнаете, что такое дисперсия и стандартное отклонение, как найти t-критерий Стьюдента и U-критерий Манна-Уитни, для чего используются регрессионный и факторный анализы, а также многое и многое другое.
И все это — на простых и понятных примерах из жизни милых и пушистых котиков, которые дарят нам множество приятных эмоций.

Статистика и котики - читать онлайн бесплатно ознакомительный отрывок

Статистика и котики - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Владимир Савельев
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Что вводить:

1. Переместите целевую переменную в поле « Зависимая переменная ».

2. Переместите переменные-факторы в « Независимые переменные ».

Дополнительные опции:на главном окне вы можете выбрать метод линейной регрессии. Как правило, « Ввод » и « Пошагово ».

Нажав на кнопку « Статистики », вы сможете выбрать некоторые дополнительные коэффициенты, которые выдаст вам программа.

Куда смотреть:смотрим в таблицу « Коэффициенты ». Там нас будут интересовать два столбца — « B » и « Значимость ». В первом из них — регрессионные коэффициенты. Во втором — p-уровень значимости. Если он меньше 0,05, то данный фактор является значимым.

Вторая интересующая нас таблица — сводка для модели. Смотрим столбец « Скорректированный R-квадрат ». В нем — коэффициент детерминации, который скажет, какой процент ваших данных объясняет модель. R-квадрат, равный 0,92, обозначает, что 92% ваших данных объясняется вашей моделью.

ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ

Как найти: Анализ —> Регрессия —> Логистическая…

Что вводить:

1. Переместите целевую переменную в поле « Зависимая переменная ».

2. Переместите переменные-факторы в « Ковариаты ».

Дополнительные опции:на главном окне вы можете выбрать метод логистической регрессии. По умолчанию установлен « Ввод » (или « Enter »).

Нажав на кнопку « Параметры », вы сможете выбрать некоторые дополнительные статистики и графики. Также я очень рекомендую поставить галочку в графе « На последнем шаге ».

Куда смотреть:пролистываем вывод вниз (до Блок 1) и смотрим в таблицу « Переменные в уравнении ». Интересуют нас два столбца: « B » и « Значимость ». Первый содержит регрессионные коэффициенты. Второй — p-уровень значимости. Если он меньше 0,05, то данный фактор является значимым.

Вторая таблица — « Сводка для модели ». Смотрим столбец « R-квадрат Нэйджелкерка ». Этот коэффициент показывает, сколько процентов ваших данных объясняет полученная модель. R-квадрат, равный 0,92, обозначает, что 92% ваших данных объясняется вашей моделью.

И последнее — « Таблица классификации ». Она позволяет сравнить, насколько результаты, предсказываемые моделью, совпадают с реальными.

ДИСКРИМИНАНТНЫЙ АНАЛИЗ

Как найти: Анализ —> Классификация —> Дискриминантный анализ.

Что вводить:

1. Переместите переменную, делящую ваши объекты на группы, в поле « Группировать по ». Далее — задайте диапазон, в котором находятся ваши группы (допустим от 1 до 3, если группы обозначаются как 1, 2 и 3).

2. Переместите остальные переменные в поле « Независимые ».

3. Нажмите кнопку « Статистики » и отметьте « Однофакторный дисперсионный анализ ».

4. Нажмите кнопку « Классифицировать » и отметьте « Итоговая таблица ».

Дополнительные опции:на главном окне вы можете выбрать метод дискриминантного анализа (« Принудительное включение » или « Шаговый отбор »).

В окне « Статистики » вы также можете выбрать « Средние », что даст описательную статистику по каждой из групп.

Куда смотреть:в таблице «Критерии равенства групповых средних» можно посмотреть, какие переменные значимо разделяют ваши объекты на группы (столбцы « F » и « Значимость »). Если значимость меньше 0,05, то разделяет.

Значения коэффициентов стандартизованной канонической дискриминантной функции можно найти в одноименной таблице (если это действительно необходимо).

Что касается меры качества, то таковой может служить таблица « Результаты классификации ». В ячейках [0,0] и [1,1] находятся правильно классифицированные объекты, а в остальных — ошибочно определенные.

ИЕРАРХИЧЕСКАЯ КЛАСТЕРИЗАЦИЯ

Как найти: Анализ —> Классификация —> Иерархическая кластеризация…

Что вводить:

1.Переместите признаки, по которым ваши объекты будут распределяться на группы, в поле « Переменные ».

2. В разделе « Графики » отметьте галочкой « Дендрограмма ».

Дополнительные опции:нажав кнопку « Статистики », вы можете потребовать у компьютера вывести принадлежность объектов к кластерам на том или ином этапе кластеризации. Кроме того, у него можно затребовать матрицу расстояний между объектами (она же — « Матрица близостей »).

В разделе « Метод » вы можете выбрать способ выделения кластеров, а также меру расстояния.

Куда смотреть:на дендрограмме показана принадлежность объектов к тому или иному классу на всех этапах кластеризации.

Если же вы отметили соответствующую галочку, то вы можете посмотреть принадлежность объектов к кластеру на определенном этапе кластеризации в таблице « Принадлежность к кластерам ».

К-СРЕДНИХ

Как найти: Анализ —> Классификация —> Кластеризация К-средними.

Что вводить:

1. Переместите признаки, по которым ваши объекты будут распределяться на группы, в поле « Переменные ».

2. Выберите число кластеров.

3. В разделе « Параметры » отметьте « Конечный кластер для каждого наблюдения ».

Дополнительные опции:ничего интересного.

Куда смотреть:из таблицы « Принадлежность к кластерам » можно увидеть, какой объект к какому кластеру принадлежит.

А в таблице « Конечные центры кластеров » расположены координаты каждого центроида.

ФАКТОРНЫЙ АНАЛИЗ

Как найти: Анализ —> Снижение размерности —> Факторный анализ.

Что вводить:

1. Переместите переменные, на основе которых будут выделяться факторы, в поле « Переменные ».

2. Нажмите на кнопку « Вращение » и выберите метод вращения (чаше всего « варимакс »).

Дополнительные опции:в разделе « Извлечение » можно выбрать метод извлечения, вывести график собственных значений или настроить количество факторов, которые выделятся по итогу.

Куда смотреть:результаты факторного анализа находятся в « Повернутой матрице компонентов ». Там — коэффициенты корреляции между факторами и отдельными переменными.

Собственные значения факторов можно посмотреть в таблице « Объясненная совокупная дисперсия ».

Приложение 3. Что еще посмотреть?

Если после прочтения данной книги вы заинтересовались статистикой, то было бы не лишним узнать, что еще можно посмотреть по данной тематике.

В первую очередь я бы рекомендовал курсы института биоинформатики на сайте www.stepik.org. А именно «Основы статистики» в трех частях, который ведут Анатолий Карпов, Иван Иванчей, Полина Дроздова и Арсений Москвичев. Там все просто, доходчиво и талантливо. А демонстрируемая глубина изложения встречается далеко не в каждом учебнике.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Владимир Савельев читать все книги автора по порядку

Владимир Савельев - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Статистика и котики отзывы


Отзывы читателей о книге Статистика и котики, автор: Владимир Савельев. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x