У. Венэбльз - Введение в R версия 3.5.2 (2018-12-20). Заметки по R: среда программирования для анализа данных и графики
- Название:Введение в R версия 3.5.2 (2018-12-20). Заметки по R: среда программирования для анализа данных и графики
- Автор:
- Жанр:
- Издательство:неизвестно
- Год:неизвестен
- ISBN:9785449661531
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
У. Венэбльз - Введение в R версия 3.5.2 (2018-12-20). Заметки по R: среда программирования для анализа данных и графики краткое содержание
Введение в R версия 3.5.2 (2018-12-20). Заметки по R: среда программирования для анализа данных и графики - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Введение в R версия 3.5.2 (2018-12-20)
Заметки по R: среда программирования для анализа данных и графики
У. Н. Венэбльз
Д. М. Смит
Переводчик Александр Александрович Фоменко
© У. Н. Венэбльз, 2019
© Д. М. Смит, 2019
© Александр Александрович Фоменко, перевод, 2019
ISBN 978-5-4496-6153-1
Создано в интеллектуальной издательской системе Ridero
Предисловие
Данное введение в R получено из исходного набора примечаний, описывающих среду S и SPlu s, написанных в 1990—2 Биллом Венэбльзом и Дэвидом М. Смитом в университете Аделаиды. Сделано много небольших изменений для отражения различий между программами R и S, и развернули часть материала.
Выражаем искреннюю благодарность Биллу Венэбльзу (и Дэвиду Смиту), гарантировавших разрешение распространения этой модифицированной версии заметок, поддержав, таким образом, R от пути назад.
Комментарии и исправления всегда приветствуются. Пожалуйста, адресуйте корреспонденцию на электронную почту R-core@R -project.org .
Предложения читателю
Большинство новичков R начнет с вводного сеанса в Приложении A. Он познакомит со стилем сеансов R и, что еще более важно, даст некоторое впечатление о том, что фактически происходит.
Многие пользователи придут в R, главным образом, из-за его средств графики. Смотри Главу 12 [Графика], которую можно прочесть в почти любое время и не следует ожидать усвоения всех предыдущих разделов.
О переводе
Данная книга является переводом документации, доступной на английской языке в составе дистрибуции R . После установки оригинал перевода доступен по адресу \ каталог R\doc\manual\R-intro . Если данный файл перевода переименовать в R-intro и заменить оригинальный файл на данный, то из справки по R будет доступен данный перевод.
Перевод выполнен полностью за некоторыми отличиями:
– в частично исключены тексты, относящиеся к иным ОС, кроме Windows;
– исключены справочные приложения, в которых были собраны ссылки на функции и термины в английском тексте;
– расширен раздел по пакетам за счет описания пакетов, применяемым в эконометрике.
Переводчик будет благодарен за выявленные ошибки и неточности.
1. Введение и предварительные замечания
1.1. Среда R
R представляет собой набор программных средств для манипулирования данными, вычисления и графического отображения. Кроме этого возможно:
– эффективная обработка и хранение данных,
– набор операторов для вычислений на массивах, особенно матрицах,
– цельная, непротиворечивая, комплексная коллекция утилит для анализа данных,
– графические средства для анализа данных и отображения или непосредственно на компьютере или при выводе на печать, и
– хорошо разработанный, простой и эффективный язык программирования (называемый « S »), который включает условные выражения, циклы, определяемые пользователем рекурсивные функции и средства ввода и вывода. Действительно, большинство поддерживаемых системой функций сами написаны на языке S .
Термин «окружение/среда» предназначен, чтобы характеризовать ее как полностью запланированную и последовательную систему, а не постепенно возникшего конгломерата весьма специфических и негибких инструментов, как часто имеет место с другим программным обеспечением анализа данных.
R является средством разработки методов интерактивного анализа данных. Она была разработана быстро и была расширена большим количеством пакетов. Однако, большинство программ, написанных в R , принципиально являются программами-однодневками, написанными для конкретного случая анализа данных.
1.2. Связанное программное обеспечение и документация
R можно рассмотреть как реализацию языка S , который разработан в Bell Laboratories Риком Беккером, Джоном Чемберсом и Алланом Уилксом, и который собственно лежит в основе систем S-Plus .
Эволюция основ языка S характеризуется четырьмя книгами Джона Чемберса с соавторами. Для R основой является «Новый Язык S: Среда программирования для анализа данных и графики», написанной Ричардом А. Беккером, Джоном М. Чемберсом и Алланом Р. Уилксом. Новые функции S, опубликованные 1991, даны в «Статистических моделях в S», отредактированном Джоном М. Чемберсом и Тревором Дж. Хэсти. Формальные методы и классы пакета методов основаны на описанных в «Программировании с данными» Джоном М. Чемберсом. См. Приложение F [Ссылки], для точной ссылки.
Сейчас есть много книг, которые описывают использование R для анализа данных и статистики, и документация для S/S-Plus может, как правило, использоваться с R, если помнить различия между реализациями S .
1.3. R и статистика
Наше введение в среду R не упоминает статистику, но много людей используют R в качестве системы статистики. Будем думать о ней как о среде, в пределах которой были реализованы много классических и современных статистических методов. Некоторые из них встроены в основу среды R, но многие предоставлены как пакеты. В составе R существует около 25 пакетов (названных «стандартными» и «рекомендуемыми» пакетами), и еще больше доступно через семейство сайтов CRAN (через http://CRAN.R -project.org) и из других источников. Более подробную информацию о пакетах рассмотрим позже (см. Главу 13 [Пакеты]).
Большинство классических статистик и многое из последних методик доступно для использования в R, но пользователи должны быть готовы к небольшим усилиям для поиска нужного.
Есть важное различие в философии между S (и, следовательно, R ) и другими основными статистическими системами. В S статистический анализ обычно делается как ряд шагов с промежуточными результатами, сохраненными в объектах. Таким образом, тогда как SAS и SPSS дадут обильные результаты регрессионного или дискриминантного анализа, R выведет минимум результатов и сохранит их в подогнанном объекте для последующего использования функциями R.
1.4. R и система Window
Самый удобный способ пользоваться R – это использовать графическую рабочую станцию с окнами. Это руководство нацелено на пользователей, у которых есть это средство. В особенности мы будем иногда обращаться к использованию R в Windows, хотя обширный объем того, что сказано, обычно применим к любой реализации среды R.
Читать дальшеИнтервал:
Закладка: