Читать онлайн «Введение в прикладной статистический анализ в пакете R. Учебно-методическое пособие»

Автор В. А. Зорин

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Нижегородский государственный университет им. Н. И. Лобачевского Национальный исследовательский университет Учебно-научный и инновационный комплекс «Модели, методы и программные средства» Зорин А. В. , Федоткин М. А. Введение в прикладной статистический анализ в пакете R (Учебно-методическое пособие) Мероприятие 1. 2. Совершенствование образовательных технологий, укрепление материально-технической базы учебного процесса Учебные дисциплины: «Теория вероятностей и математическая статистика», «Ком- пьютерные технологии анализа статистических данных» Специальности, направления: «Прикладная математика и информатика», «При- кладная информатика», «Информационные технологии» ННГУ 2010 Введение Специализированные программные комплексы для статистического анализа данных играют важную роль во многих областях науки и бизнеса. Такие про- граммы должны обладать несколькими специфическими особенностями: уметь эффективно хранить данные разных типов и обеспечивать легкий доступ к ним, эффективно выполнять трудоемкие вычислительные задачи, осуществлять пре- образование данных из разных форматов, представлять графически данные и ре- зультаты анализа, иметь встроенный язык для создания расширений и добавления новой функциональности в различных прикладных областях, обладать богатым набором методов решения основных статистических задач. В настоящее время существует несколько конкурирующих между собой коммерческих продуктов, та- ких как SPSS, STATISTICA, и т. д. , поддерживающих весь спектр возможностей. Отметим также наличие статистических функций и дополнительных надстроек у программ электронных таблиц Microsoft Excel и OpenOffice Calc.
Наконец, прак- тически все современные программы для проведения математических расчетов (Mathematica, Maple, Matlab, Mathcad, Scilab, Octave, и т. д. ) общего назначения имеют функции для выполнения основных процедур прикладного статистического анализа. В научном сообществе пользуется популярностью пакет статистического ана- лиза данных R [1]. Это свободно распространяемые на условиях лицензии GNU язык и среда вкупе с большим набором библиотек, доступные для всех основных платформ — UNIX, Linux, Windows и MacOS. Постоянно выходят новые версии и расширения. Важным показателем популярности продукта является выход книг с описанием применения R для тех или иных видов анализа [2, 3, 4]. Знакомство с этим пакетом позволит получить базовые навыки постановки статистической проблемы и решения ее «до числа», продемонстрирует основные методы про- ведения статистического анализа данных и интерпретации численных значений разнообразных статистик и оценок, возникающих в повседневной практике. Минимальная сессия в R представлена ниже. На ее примере мы объясним некоторые принятые шрифтовые и типографский соглашения. 1 R version 2. 11. 1 (2010-05-31) 2 Copyright (C) 2010 The R Foundation for Statistical 3 Computing ISBN 3-900051-07-0 4 5 R -- это свободное ПО, и оно поставляется безо всяких 6 гарантий.