Валентин Арьков - Статистический анализ взаимосвязи в Excel

Тут можно читать онлайн Валентин Арьков - Статистический анализ взаимосвязи в Excel - бесплатно ознакомительный отрывок. Жанр: Прочая научная литература, год 2019. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Валентин Арьков - Статистический анализ взаимосвязи в Excel краткое содержание

Статистический анализ взаимосвязи в Excel - описание и краткое содержание, автор Валентин Арьков, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Рассматриваются такие инструменты статистического анализа взаимосвязи, как корреляционный и регрессионный анализ. Техника работы в пакете Excel изучается на примере смоделированных данных. Затем полученные навыки применяются к анализу реальных данных по ценам в интернет-магазине и биржевым котировкам на Московской бирже.

Статистический анализ взаимосвязи в Excel - читать онлайн бесплатно ознакомительный отрывок

Статистический анализ взаимосвязи в Excel - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Валентин Арьков
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Элемент диаграммы

Самый простой способ получить уравнение регрессии и нанести линию регрессии на график — построить диаграмму разброса и вызвать встроенную, автоматическую функцию

Trendline

Линия тренда.

Название этой функции достаточно своеобразное. К нему тоже надо отнестись с пониманием. На самом деле ТРЕНД — это основная тенденция, общее направление при изменении значений во времени. Подробнее мы рассмотрим тренд в третьей работе на тему «Динамика». Фактически здесь строится линия регрессии. При построении линии тренда тоже используют методы регрессионного анализа, только вместо «иксов» берут моменты времени.

Слово РЕГРЕССИЯ здесь более подходящее, оно более универсальное, хотя и незнакомое для массового потребителя. Видимо, разработчики решили, что слово ТРЕНД более привычно для пользователей. Оно часто встречается в рекламе и даже в названиях некоторых товаров.

Щёлкнем по диаграмме разброса левой кнопкой мыши. Как показано на рисунке, справа от поля графика нажмём кнопку со знаком ПЛЮС:

Chart Elements

Элементы диаграммы.

Выбираем в качестве элемента графика

Trendline

Линия тренда.

Указываем линейную функцию:

Linear

Линейный.

Автоматическое построение регрессии

Есть и другой способ управлять элементами графика. Щёлкнем левой кнопкой мыши по графику и выберем в верхнем меню:

Design — Add Chart Element — Trendline — Linear

Конструктор — Добавить элемент диаграммы — Линия тренда — Линейный.

Добавление линии тренда

Добавим на график уравнение регрессии.

Design — Add Chart Element — Trendline — More Trendline options

Конструктор — Добавить элемент диаграммы — Линия тренда — Дополнительные параметры линии тренда.

В окне настройки элементов графика выбираем:

Format Trendline — Trendline options — Display Equation on chart

Формат линии тренда — Параметры линии тренда — показывать уравнение на диаграмме.

Вывод уравнения регрессии

На графике действительно появляется уравнение. Чтобы рассмотреть его получше, перетащим это уравнение мышкой на свободное место.

Уравнение регрессии на графике

Сравним полученное уравнение с нулевым вариантом задания. Значения коэффициентов похожи. Конечно, есть небольшое различие. Это случайная ошибка, вызванная случайным разбросом Еи ограниченным объёмом выборки N.

Условное среднее

Кроме линии регрессии, есть другой способ изучения той же зависимости — УСЛОВНОЕ СРЕДНЕЕ, то есть среднее при выполнении некоторого условия. Это среднее арифметическое значений результативного признака YПРИ УСЛОВИИ, что соответствующие значения факторного признака Xпопадают в заданный интервал.

Вот пример условного среднего: средний вес людей, у которых рост окажется в диапазоне от 160 до 170 см. Мы выбираем людей ростом от 160 до 170 см, измеряем их вес и находим среднее значение веса только по этой группе. Здесь рост — это факторный признак Х, а вес — это результативный признак Y. Мы получили средний «игрек», а условие определяли по «иксу».

На новом листе добавим интервалы группировки по X: нижние и верхние границы, а также среднее значение. Интервалы группировки выбираем точно так же, как описано в первой работе. Ссылка для скачивания пособия по первой работе приводится в конце данного выпуска.

В нашем примере возьмём 10 интервалов по 100 единиц, чтобы охватить диапазон значений от 1000 до 2000.

Для нахождения условного среднего можно использовать функцию

SUMIF

СУММЕСЛИ.

Функция позволяет вычислить сумму при выполнении заданного условия. Формат функции следующий:

SUMIF (range, criteria, [sum_range])

СУММЕСЛИ (диапазон; критерий; [диапазон_суммирования])

rangeдиапазон — диапазон ячеек;

criteriaкритерий — условие ;

sum_rangeдиапазон_суммирования — диапазон ячеек для суммирования. Если диапазон не указан, то суммируются значения из диапазона, указанного в первом аргументе.

Для определения средних значений фактора Хв каждом интервале группировки используем только два первых аргумента функции.

Рассмотрим примеры условных сумм — см. формулы.

Условные суммы

Первая формула вычисляет сумму значений фактора, не превышающих верхнюю границу первого интервала. Сюда попадут все значения из первого интервала, а также все точки, которые окажутся левее этого интервала.

Вторая формула определяет сумму значений фактора, попадающих во второй интервал.

В третьей формуле мы фиксируем номера строк для диапазона исходных данных с помощью символа $. Это позволит нам скопировать формулу и заполнить весь столбец.

Для упрощения расчётов мы определяем разность сумм значений, не превышающих верхние границы интервалов. В этом случае формулы получаются немного короче и понятнее. Мы уже использовали подобный приём в первой работе, когда определяли частоту попадания в интервал. Мы находили относительные частоты как разность соседних значений накопленной частоты.

Функция SUMIF

При вычислении среднего арифметического нужно поделить сумму значений на их количество.

Для определения количества элементов используем функцию

COUNTIF

СЧЕТЕСЛИ.

Формула для расчета условного среднего фактора Хполучается довольно громоздкой — см. формулы.

Расчёт условного среднего

Изучите формулы и найдите следующие элементы:

— диапазон ячеек от А2до А121на листе 04;

— верхняя граница первого интервала на листе 05;

— верхняя граница второго интервала на листе 05.

Чтобы не запутаться, проведём наши расчёты по частям. Сначала найдём суммы и количества значений Х,не превышающих верхней границы. Затем определим разности соседних ячеек. Затем проведём деление и в результате получим среднее значение Хв каждом интервале группировки.

Вычисление условного среднего значения результативного признака Yнемного сложнее. Здесь проверяется условие попадания факторного признака Хв интервал группировки, а сумма считается по столбцу результативного признака Y. Для этого используется третий аргумент функции SUMIF — см. формулу.

Условное среднее Y (X)

Для копирования формулы фиксируем номера строк с помощью знака $.

Вычисление условного среднего

После вычислений наносим линию условного среднего на диаграмму разброса. Для этого нам потребуется ломаная линия с маркерами точек.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Валентин Арьков читать все книги автора по порядку

Валентин Арьков - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Статистический анализ взаимосвязи в Excel отзывы


Отзывы читателей о книге Статистический анализ взаимосвязи в Excel, автор: Валентин Арьков. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x