Валентин Арьков - Бизнес-аналитика. Сводные таблицы. Часть 2

Тут можно читать онлайн Валентин Арьков - Бизнес-аналитика. Сводные таблицы. Часть 2 - бесплатно ознакомительный отрывок. Жанр: Прочая научная литература, год 2020. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Валентин Арьков - Бизнес-аналитика. Сводные таблицы. Часть 2 краткое содержание

Бизнес-аналитика. Сводные таблицы. Часть 2 - описание и краткое содержание, автор Валентин Арьков, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Данная работа посвящена дальнейшему изучению методов бизнес-аналитики на примере «продвинутых» возможностей функций сводных таблиц.
Мы продолжаем использовать общий подход к практическому освоению программного пакета: моделирование и исследование. Мы поработаем с генератором случайных чисел и сформируем реалистичные наборы данных для анализа.

Бизнес-аналитика. Сводные таблицы. Часть 2 - читать онлайн бесплатно ознакомительный отрывок

Бизнес-аналитика. Сводные таблицы. Часть 2 - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Валентин Арьков
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Вызываем вставку столбиковой диаграммы:

Insert —Charts — Insert Column or Bar Chart — 2-D Column — Clustered Column(рис. 8.6).

Рис. 8.6. Вставка столбиковой диаграммы

Выбираем данные для графика. Щёлкаем по графику правой кнопкой мыши и в контекстном меню выбираем

Select Data.

Появляется диалоговое окно Select Data Source(рис. 8.7).

В разделе Legend Entries (Series)нажимаем кнопку Addи указываем столбец относительных частот в качестве значений Series Values.Естественно, мы не включаем сюда последнюю строку сводной таблицы с общим итогом.

В разделе Horizontal (Category) Axis Labelsнажимаем кнопку Editи указываем заголовки строк, где выводятся интервалы группировки. Это будут текстовые метки по оси «иксов» Axis Label Range.

Рис. 8.7. Выбор данных для диаграммы

Мы получили столбиковую диаграмму частот (рис. 8.8).

Рис. 8.8. Столбиковая диаграмма

Задание. Постройте столбиковую диаграмму относительных частот.

В соответствии со стандартами, наши столбики должны вплотную примыкать друг к другу.

Дважды щёлкнем по любому столбику, чтобы вызвать меню

Format Data Series.

Делаем следующие настройки:

Series Options — Series Overlap = 0;

Gap Width = 0.

Теперь столбцы примыкают друг к другу.

Медлу столбиками нет просветов.

Эта картина соответствует идее группировки.

При группировке данных наши интервалы идут вплотную друг другу. Любое значение должно попасть в какой-нибудь интервал. Мы никого и ничего не пропускаем.

Рис. 8.9. Столбцы примыкают друг к другу

Задание.Настройте ширину столбиков и «перекрытие».

График стал немного ближе к правильному изображению гистограммы.

Осталось убрать заливку столбиков.

Когда много столбиков залиты краской, на график становится неприятно смотреть. Эта заливка не добавляет наглядности. И даже затрудняет восприятие — в данном конкретном случае. В других случаях разноцветные картинки будут очень даже кстати.

Делаем следующие настройки диаграммы:

Fill — No fill;

Border — Solid line.

Цвет линии лучше сделать чёрным, хотя это дело вкуса.

Главное, чтобы график легко и без усилий воспринимался на глаз. С первого взгляда, а не с десятого.

Рис. 8.10. Отключение заливки

Задание. Отключите заливку столбиков на диаграмме

Осталось растянуть график, чтобы метки по оси «иксов» расположились по вертикали.

Метки до оси «игреков» сделаем целыми значениями процентов.

Щёлкаем по вертикальной оси делаем следующую настройку:

Axis Options — Number — Decimal Places = 0 (рис. 8.11).

Рис. 8.11. Формат числовых меток

Задание. Настройте формат числовых меток.

Рассмотрим полученную гистограмму (рис. 8.12).

На графике можно легко увидеть три вершины. В стороны от этих вершин график плавно спадает, уменьшается.

В статистике такие вершины называют словом МОДА. Наличие нескольких мод говорит о том, что в исходных данных присутствует СМЕСЬ РАСПРЕДЕЛЕНИЙ. То есть у нас перемешаны данные об объектах разного типа. Очень разного типа. Их называют РАЗНОРОДНЫМИ.

В нашем случае это могут быть разные категории товаров.

Рис. 8.12. Гистограмма

Задание. Рассмотрите полученную гистограмму и определите количество вершин (мод) на графике.

Попробуем рассмотреть распределение «по частям».

Выделим ОДНОРОДНЫЕ данные об объектах одного типа.

Для начала пусть это будут категории товаров.

Добавляем в нашу сводную таблицу фильтр по категориям товаров. Перетаскиваем поле «Категория» в раздел Filters(рис. 8.13).

Соответствующий фильтр появляется над сводной таблицей.

Рис. 8.13. Фильтр по категориям товаров

Задание. Добавьте фильтр по категориям товаров в сводную таблицу.

Проведём фильтрацию по овощам.

Получаем гистограмму, в которой тоже есть три вершины.

Фильтрация по категории товара не помогла.

Рис. 8.14. Распределение по овощам

Задание. Проведите фильтрацию по категориям и обратите внимание на число вершин.

Проведём фильтрацию по конкретному товару.

Заменяем фильтр на «Товар».

Фильтруем сводную таблицу по одному товару (рис. 8.15).

При необходимости указываем диапазон ячеек для графика так, чтобы исключить общий итог. Итог 100% даст на графике один ненужный пик, и к тому же очень высокий пик.

В полученной гистограмме тоже имеется три вершины.

Это поведение отдельного товара.

Вершины соответствуют следующим значениям:

1,9

2,9

3,9.

Рис. 8.15. Фильтрация по товару

Задание. Проведите фильтрацию по одному товару и обратите внимание на число вершин распределения.

Построим диаграмму разброса по исходным данным из таблицы транзакций.

Оставим только данные по одному товару.

Переходим к таблице транзакций.

Щёлкаем по заголовку столбца «Товар».

Выбираем один товар (рис. 8.16).

Нажимаем ОК.

Рис. 8.16. Выборка данных по товару

Задание. Настройке вывод данных о транзакциях по одному товару.

Построим диаграмму разброса «Дата — Количество товара».

Можно видеть, что положение трёх вершин соответствует периодам, когда диаграмма динамики количества товара находилась примерно на одном уровне. Здесь концентрируется больше значений.

Переходы от одного уровня к другому дают нам плавное снижение гистограммы. Здесь находится меньшее количество значений.

Вот мы и нашли причину нескольких вершин (мод) на гистограмме. Это периодические (сезонные) изменения спроса на фоне растущего тренда.

В теории известно, что наличие периодических колебаний влияет на форму кривой распределения. Мы с этим явлением познакомились практически.

Рис. 8.17. Уровни — источники вершин

Задание. Постройте диаграмму разброса и сравните расположение вершин на гистограмме с уровнями в динамике.

8.2. Анализ взаимосвязи

Второй пример использования статистической группировки —это изучение взаимосвязи между признаками. Нас интересует явление под названием КОРРЕЛЯЦИЯ — это увеличение или уменьшение оного признака в зависимости от значения другого. Это зависимость В СРЕДНЕМ. Выглядит такая зависимость как разброс точек вокруг некоторой линии (прямой, кривой, или ломаной).

Если пытаться построить уравнение связи, это будет называться РЕГРЕССИЯ.

Мы занимались статистическим анализом взаимосвязи в работе [2]. Теория разбирается в соответствующих учебниках.

Задание. Изучите в учебнике «Теория статистики» главу «Взаимосвязь явлений» и выясните, что общего и в чём разница между корреляцией и регрессией.

Группировка позволяет определить так называемое УСЛОВНОЕ СРЕДНЕЕ ЗНАЧЕНИЕ. Это среднее значение одной величины при условии, что другая величина принимает заданное значение. Например, средний вес людей ростом от 160 до 165 см.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Валентин Арьков читать все книги автора по порядку

Валентин Арьков - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Бизнес-аналитика. Сводные таблицы. Часть 2 отзывы


Отзывы читателей о книге Бизнес-аналитика. Сводные таблицы. Часть 2, автор: Валентин Арьков. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x