Денис Соломатин - mixOmics для гуманитариев

Тут можно читать онлайн Денис Соломатин - mixOmics для гуманитариев - бесплатно ознакомительный отрывок. Жанр: Программы, год 2021. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Денис Соломатин - mixOmics для гуманитариев краткое содержание

mixOmics для гуманитариев - описание и краткое содержание, автор Денис Соломатин, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Тематика посвященного основам статистической обработки педагогической информации учебного пособия оказалась на редкость востребованной и актуальной, что послужило стимулом к написанию продолжения. Учебное пособие предназначено для бакалавров, обучающихся по направлению подготовки «Математическое образование» интересы которых лежат в области статистической обработки социальной и педагогической информации. Из отличительных особенностей R хорош тем, что бесплатен и установлен на серверах Google Cloud и ИМ СО РАН, а значит позволяет задействовать вычислительную мощь современных суперкомпьютеров. Кроме того, статистический анализ большого числа переменных на сегодняшний день лучше всего реализован в его дополнительном пакете mixOmics, а в современных реалиях R позволяет неподготовленному читателю разворачивать веб-сервер для решения задач собственной онлайн-школы, на открытие которой всё больше нас вдохновляют современные реалии.

mixOmics для гуманитариев - читать онлайн бесплатно ознакомительный отрывок

mixOmics для гуманитариев - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Денис Соломатин
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Другие параметры также могут быть настроены дополнительно, с полным списком настроек можно ознакомиться вызвав ?pca.

В примере, показанном выше, две пары тем не являются значительно отличающимися визуально, поэтому конкретные образцы должны быть дополнительно исследованы, тогда участок корреляционного круга, содержащий много переменных, можно будет легко интерпретировать. Ниже будет показано, как улучшить полученные диаграммы, чтобы облегчить интерпретацию результатов.

Диаграммы можно настроить с помощью многочисленных опций в plotIndiv и plotVar. Даже если PCA не принимает во внимание какую-либо информацию об известном членстве в группе каждой выборки, можно включить такую информацию в выборку для визуализации любого «естественного» кластера данных, который может быть обусловлен педагогической спецификой и условиями отбора группы.

Так, например, следующая команда включает информацию о классе в группах выборки аргументом группирования:

plotIndiv(My_result.pca, group = My_table$Класс,

legend = TRUE)

Кроме того два фактора могут отображаться с использованием как цветов - фото 8

Кроме того, два фактора могут отображаться с использованием как цветов (аргумент group), так и символов (аргумент pch). Например, отобразим класс и оценки, полученные по второй теме, изменив при этом название и легенду диаграммы:

plotIndiv(My_result.pca, ind.names = FALSE,

group = My_table$'Класс',

pch = as.factor(My_table$'Тема2'),

legend = TRUE, title = 'Успеваемость по второй теме',

legend.title = 'Класс', legend.title.pch = 'Оценка')

Путем добавления информации связанной с классом и оценкой появляется - фото 9

Путем добавления информации, связанной с классом и оценкой появляется возможность увидеть кластер наблюдений успеваемости близких к эталонному образцу (зелёный ромб в левом нижнем углу), в то время как образцы с низкой успеваемостью (синие треугольники) оказались сгруппированы отдельно, но явно обнаруживается эффект разделения обучающихся на классы.

Чтобы отобразить результаты на других компонентах, можно изменить аргумент comp при условии, что было запрошено достаточно компонент для расчета. Приведём второй пример PCA с тремя компонентами, в котором третий компонент по оси PC3 четко разграничивает обучающихся по классам:

My_result.pca2 <���– pca(X, ncomp = 3)

plotIndiv(My_result.pca2,

comp = c(1,3),

legend = TRUE,

group = My_table$'Класс',

legend.title = 'Класс',

title = 'Анализ успеваемости, PCA 1-3')

В связи с этим возникает естественный вопрос об оптимальном количестве главных - фото 10

В связи с этим возникает естественный вопрос об оптимальном количестве главных компонент. С другой стороны, важную роль в дисперсионном анализе (ANOVA) играет объясненная дисперсия, пропорционально характеризующая долю общего числа образцов, охватываемую той или иной главной компонентой. Объяснённая дисперсия может быть представлена наглядно, функцией plot, либо фактическими численными её пропорциями и накапливаемыми пропорциями:

plot(My_result.pca2)

Следующая команда Myresultpca2 Выведет собственные значения для первых трех - фото 11

Следующая команда:

My_result.pca2

Выведет собственные значения для первых трех главных компонент:

PC1 PC2 PC3

2.8142478 1.2477355 0.7394421

Пропорциональное отношение объяснённой ими дисперсии:

PC1 PC2 PC3

0.5433274 0.2408917 0.1427590

И совокупное значение оной по мере увеличения числа главных компонент:

PC1 PC2 PC3

0.5433274 0.7842191 0.9269781

К сожалению, не существует строгих правил, руководствуясь которыми можно определить, сколько компонентов должно быть включено в PCA, – это зависит от данных и от уровня шума. Зачастую просто по приведённой выше диаграмме делают вывод о том, что увеличение количества главных компонент в модели не способствует резкому увеличению оставшейся доли объяснённой дисперсии.

С другой стороны, всегда можно посмотреть на переменные коэффициенты в каждом компоненте с векторами нагрузки. Весы нагрузки представлены по убыванию абсолютной величины снизу вверх. Абсолютное значение указывает на важность каждой переменной для определения каждого главной компоненты и представлено длиной каждого прямоугольника:

plotLoadings(My_result.pca)

Можно открыть справку командой plotLoadings чтобы ознакомиться с полным - фото 12

Можно открыть справку командой ?plotLoadings, чтобы ознакомиться с полным списком аргументов. Следующий пример покажет только две темы, оказавших наибольше влияние на разделение, с указанием их названий и увеличением шрифта на 10%:

plotLoadings(My_result.pca, ndisplay = 2,

name.var = c('первая тема','вторая тема','третья тема','четвертая тема','пятая тема'),

size.name = rel(1.1))

Такое представление будет особенно информативным в случае когда необходимо - фото 13

Такое представление будет особенно информативным в случае, когда необходимо выбирать из нескольких переменных. Диаграммы и графики можно отображать интерактивно в 3D, используя стилевую опцию style="3d". Для этого используется пакет rgl, устанавливаемый и подключаемый предварительно:

Конец ознакомительного фрагмента.

Текст предоставлен ООО «ЛитРес».

Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Денис Соломатин читать все книги автора по порядку

Денис Соломатин - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




mixOmics для гуманитариев отзывы


Отзывы читателей о книге mixOmics для гуманитариев, автор: Денис Соломатин. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x