Описательная статистика на базе Пакета анализа данных Excel. Двухфакторный дисперсионный анализ с повторениями


В этой статье речь пойдёт о том, как провести анализ данных с помощью сводной таблицы. Для тренировки Вы можете использовать таблицу, доступную по этой ссылке (простая таблица.xlsx).


Первое, что может понадобиться проанализировать с помощью сводной таблицы - это подвести промежуточные итоги. В нашем примере это может быть необходимость подсчитать объемы продаж по всем магазинам на каждую дату.


Для этого необходимо кликнуть на любом заголовке строки сводной таблицы (в нашем примере - это поля Дата, Точка продажи и Марка телефона ), и в открывшихся вкладках Работа со сводными таблицами перейти на вкладку Параметры . На ней необходимо нажать кнопку Параметры поля в группе Активное поле .


В открывшемся окне первой закладкой будет закладка .

Отсутствие такой закладки означает, что Вы не выбрали заголовок строки, то есть курсор установлен на ячейке с числовым значением.


На закладке Промежуточные итоги и фильтры Вы можете выбрать условие для выведения промежуточных итогов. Предлагаются следующие условия:

  • автоматически - подсчитывает сумму для каждого условия таблицы;
  • нет - промежуточные итоги не подсчитываются;
  • другие - позволяет самостоятельно выбрать действие для подведения промежуточных итогов.

Установив автоматическое подведение промежуточных итогов, мы получим следующую таблицу, которая содержит промежуточные итоги для каждого условия:




Если настройка промежуточных итогов с помощью команды Параметры поля , не даёт видимых результатов, проверьте настройки отображения промежуточных итогов с помощью команды Промежуточные итоги группы Макет вкладки Конструктор .


Допустим, нам необходимо вывести промежуточные итоги только для дат, скрыв промежуточные итоги для точек продаж. Для этого щелкните на любое поле таблицы с названием магазина и вызовите контекстное меню. В нём нужно убрать галочку с условия Промежуточный итог: точка продажи . Как мы видим, промежуточные итоги остались только для дат:




Часто бывает необходимо отсортировать данные сводной таблицы, для лучшего их восприятия. Для этого достаточно выбрать поле, по которому нужно провести сортировку, перейти на вкладку Общие , в группе Редактирование нажать на кнопку Сортировка и фильтр и установить нужные Вам условия сортировки.


Очень полезной функцией для анализа информации в сводной таблице является возможность группировки данных. Например, нам нужно сгруппировать наши продажи по неделям месяца. Для этого нужно выделить даты, которые входят в первую неделю (15.05-21.05):




Обратите внимание, что для удобства выделения мы свернули данные по отдельным магазинам, воспользовавшись кнопкой + в левой части ячейки с названием магазина.


Далее нужно выполнить команду Группировка по выделенному группы Группировать вкладки Параметры . В таблице появится новый столбец, в котором поле Группа1 будет объединять выбранные нами поля.




Останется только переименовать название группы путём простого редактирования ячейки:




Для отмены группировки достаточно воспользоваться командой Разгруппировать из этой же группы, предварительно выбрав поле, которое подлежит разгруппировке. Обратите внимание, что нельзя разгруппировать поле, которое мы включили в условие построения сводной таблицы - например поле Точка продажи или Дата .


Рассмотрим ещё один способ вывода данных, который поможет нам проанализировать информацию из нашей таблицы. Например, нам нужно узнать объемы выручки не в денежном выражении, а в виде процента от общего объема выручки за весь период продаж.


Для этого нужно выделить любую ячейку в столбце Выручка нашей сводной таблицы. После этого нужно выполнить команду Параметры поля в группе Активное поле вкладки Параметры .




В открывшемся диалоговом окне необходимо перейти на вкладку Дополнительные вычисления и из выпадающего меню выбрать пункт Доля от суммы по столбцу . После нажатия кнопки Ок, наша таблица будет иметь следующий вид:




Если данные в таблице будут выводиться не в виде процентов, проверьте настройки числового формата ячеек (это можно сделать сразу же в диалоговом окне Параметры поля , нажав на кнопку Числовой формат , или вызвав соответствующее окно из контекстного меню).

Если вам нужно разработать сложные статистические или инженерные анализы, вы можете сэкономить этапы и время с помощью пакета анализа. Вы предоставляете данные и параметры для каждого анализа, и в этом средстве используются соответствующие статистические или инженерные функции для вычисления и отображения результатов в выходной таблице. Некоторые инструменты создают диаграммы в дополнение к выходным таблицам.

Функции анализа данных можно применять только на одном листе. Если анализ данных проводится в группе, состоящей из нескольких листов, то результаты будут выведены на первом листе, на остальных листах будут выведены пустые диапазоны, содержащие только форматы. Чтобы провести анализ данных на всех листах, повторите процедуру для каждого листа в отдельности.

Примечание: Чтобы включить функцию Visual Basic для приложений (VBA) для пакета анализа, вы можете загрузить надстройку " Пакет анализа - VBA " таким же образом, как и при загрузке пакета анализа. В диалоговом окне Доступные надстройки установите флажок Пакет анализа - VBA .

Чтобы загрузить пакет анализа в Excel для Mac, выполните указанные ниже действия.

    В меню Сервис выберите пункт надстройки Excel .

    В окне Доступные надстройки установите флажок Пакет анализа , а затем нажмите кнопку ОК .

    1. Если надстройка Пакет анализа отсутствует в списке поля Доступные надстройки , нажмите кнопку Обзор , чтобы найти ее.

      Если появляется сообщение о том, что пакет анализа не установлен на компьютере, нажмите кнопку Да , чтобы установить его.

      Выйдите из приложения Excel и перезапустите его.

      Теперь на вкладке Данные доступна команда Анализ данных .

Я не могу найти пакет анализа в Excel для Mac 2011

Существуют несколько сторонних надстроек, которые предоставляют функции пакета анализа для Excel 2011.

Вариант 1. Скачайте статистическое программное обеспечение надстройки КСЛСТАТ для Mac и используйте его в Excel 2011. КСЛСТАТ содержит более 200 основных и расширенных статистических средств, включающих все функции пакета анализа.

    Выберите версию КСЛСТАТ, соответствующую операционной системе Mac OS, и загрузите ее.

    Откройте файл Excel, содержащий данные, и щелкните значок КСЛСТАТ, чтобы открыть панель инструментов КСЛСТАТ.

    В течение 30 дней вы получите доступ ко всем функциям КСЛСТАТ. По истечении 30 дней вы сможете использовать бесплатную версию, включающую функции пакета анализа, или заказать одно из более полных решений КСЛСТАТ.

Вариант 2. Скачайте Статплус: Mac LE бесплатно из Аналистсофт, а затем используйте Статплус: Mac LE с Excel 2011.

Вы можете использовать Статплус: Mac LE для выполнения многих функций, которые ранее были доступны в пакетах анализа, таких как регрессия, гистограммы, анализ вариации (Двухфакторный дисперсионный обработки) и t-тесты.

    Перейдите на веб-сайт аналистсофт и следуйте инструкциям на странице загрузки.

    После загрузки и установки Статплус: Mac LE откройте книгу, содержащую данные, которые нужно проанализировать.

Microsoft Excel является одним из самых незаменимых программных продуктов. Эксель имеет столь широкие функциональные возможности , что без преувеличения находит применение абсолютно в любой сфере. Обладая навыками работы в этой программе, вы сможете легко решать очень широкий спектр задач. Microsoft Excel часто используется для проведения инженерного либо статистического анализа. В программе предусмотрена возможность установки специальной настройки, которая значительным образом поможет облегчить выполнение задачи и сэкономить время. В этой статье поговорим о том, как включить анализ данных в Excel, что он в себя включает и как им пользоваться. Давайте же начнём. Поехали!

Для начала работы нужно активировать дополнительный пакет анализа

Первое, с чего нужно начать - установить надстройку. Весь процесс рассмотрим на примере версии Microsoft Excel 2010. Делается это следующим образом. Перейдите на вкладку «Файл» и нажмите «Параметры», затем выберите раздел «Надстройки». Далее, отыщите «Надстройки Excel» и кликните по кнопке «Перейти». В открывшемся окне доступных надстроек отметьте пункт «Пакет анализа» и подтвердите выбор, нажав «ОК». В случае, если необходимого пункта нет в списке, вам придётся найти его вручную, воспользовавшись кнопкой «Обзор».

Так как вам ещё могут пригодиться функции Visual Basic, желательно также установить «Пакет анализа VBA». Делается это аналогичным образом, разница только в том, что вам придётся выбрать другую надстройку из списка. Если вы точно знаете, что Visual Basic вам не нужен, то можно ничего больше не загружать.

Процесс установки для версии Excel 2013 точно такой же. Для версии программы 2007, разница только в том, что вместо меню «Файл» необходимо нажать кнопку Microsoft Office, далее следуйте по пунктам, как описано для Эксель 2010. Также перед тем как начать загрузку, убедитесь, что на вашем компьютере установлена последняя версия NET Framework.

Теперь рассмотрим структуру установленного пакета. Он включает в себя несколько инструментов , которые вы можете применять в зависимости от стоящих перед вами задач. В списке, который представлен ниже, перечислены основные инструменты анализа, входящие в пакет:


Как вы можете убедиться, использование надстройки анализа данных в Microsoft Excel даёт значительно более широкие возможности работы в программе, облегчая для пользователя выполнение ряда задач. Пишите в комментариях была ли статья полезной для вас и, если у вас возникли вопросы, то обязательно задавайте их.

ЗАДАНИЕ № 1

Статистический анализ данных в программе MS Excel

Цель работы : научиться обрабатывать статистические данные с помощью встроенных функций MS Excel ; изучить возможности Пакета анализа и его инструменты: «Генерация случайных чисел» , «Гистограмма» , «Описательная статистика» на примере обработки измерений скорости движения.

В соответствии с методическими указаниями к лабораторной работе «Измерение скорости движения автомобилей» (по дисциплине «Изыскание и проектирование автомобильных дорог») обработать экспериментальные данные измерений методами математической статистики в программе Excel. Для чего:

1. Вычислить статистические характеристики, используя встроенные функции: - минимальное значение скорости движения Vмин;

Максимальное значение скорости движения Vмакс; - среднее значение скорости движения Vср;

Стандартное отклонение S;

Стандартное отклонение среднего Sср;

Коэффициент Стьюдента (для определения доверительного интервала) t; - доверительный интервал для Р = 0.95.

2. Получить статистические характеристики, используя инструмент « Описательная статистика » из дополнительного пакета «Анализ данных ».

3. Построить гистограмму распределения скорости движения.

4. Построить кумулятивную кривую (кривую накопленной частости).

5. Построить теоретическую кривую распределения скорости движения.

Для получения достаточного количества исходных данных (результатов измерений скорости) использовать имитационный эксперимент с помощью инструмента «Генерация случайных чисел » дополнения «Анализ данных ».

При выполнении п.п. 3 и 4 подобрать интервал скоростей («карман» – в терминологии Excel), позволяющий получить наиболее симметричную гистограмму, демонстрирующую нормальный закон распределения.

Образец выполнения приведен в прилагаемом файле ОсновыПК1-Студент.xls.

Методические указания

Предположим, что мы проделали серию из 10 опытов, измеряя некоторую величину Х. Таблица 1. Примерный вид листа «Обработка эксперимента»

Записи в колонках D и Е – это подсказки, которые помогут разобраться с тем, какие характеристики мы будем рассчитывать. Колонка F у Вас должна быть пока пустой, в нее будут помещены наши формулы.

Обработку результатов начнем с расчета числа опытов n .

Для определения числа значений используется специальная функция, которая называется СЧЕТ . Для ввода формулы с функциями используется Мастер функций , который запускается командой «Вставка функции» через меню «Вставка» – «Функция» или кнопкой на панели инструментов с обозначением f x .

Щелкнем мышкой по ячейке F6 , где должен находиться результат и запустим Мастер функций.

Первый шаг работы (рисунок 1) служит для выбора нужной функции.

Для обработки данных эксперимента используются статистические функции. Поэтому, прежде всего в списке категорий выбираем категорию «Статистические ». Во втором окне появляется список статистических функций.

Список функций упорядочен по алфавиту, что позволяет без труда найти нужную нам функцию СЧЕТ («Подсчитывает количество чисел в списке аргументов»).

Выделив щелчком эту функцию, нажимаем кнопку Ok и переходим к шагу 2.

Второй шаг (рисунок 2) служит для задания аргументов функции.

Функции СЧЕТ надо указать, какие числа ей надо пересчитывать, или в каких ячейках находятся эти числа. Следующие два этапа обработки серии опытов проводятся аналогично.

В ячейке F7 c помощью функции СРЗНАЧ рассчитывается среднее значение выборки, в ячейке F8 – стандартное отклонение выборки, с помощью функции СТАНДОТКЛОН. .

Аргументами этих функций служит все тот же диапазон ячеек.

Для расчета доверительного интервала необходимо определить коэффициент Стьюдента. Он зависит от вероятности ошибки (при обычно задаваемой надежности 95% вероятность ошибки составляет 5%), и от числа степеней свободы n-1 ).

Для нахождения коэффициента Стьюдента используется статистическая функция Excel СТЬЮДРАСПОБР (“Стьюдента распределение обратное“). Особенностью этой функции является то, что первый аргумент, число 5% (или 0,05) вводится в соответствующее окно с клавиатуры. Для второго указываем адрес ячейки, где находится значение n , затем дописываем в окне “-1”. Получаем запись “F6-1 ”.

Для нахождения доверительного интервала используется обычная формула умножения. Конечно, вместо букв там должны стоять адреса ячеек, где находятся коэффициент Стьюдента и стандартное отклонение среднего. Как правило, значение доверительного интервала округляется до одной значащей цифры, такой же порядок окружения должен быть и у среднего. Поэтому окончательный результат можно записать так: с 95%-ной надежностью Х = 14,80±0,05 . В заключение посчитаем относительную ошибку определения Х: = ДИ / Х ср (формула: “=F11/F7 ”). Значение относительной ошибки обычно выражают в процентах, у нас 0,3%.

Для выполнения заданий 2 и 3 используется надстройка «Пакет анализа» (из меню Сервис  .Анализ данных  Гистограмма).

Для установки надстройки вызвать меню Сервис  Надстройки и из предлагаемого списка доступных к установке надстроек выбрать «Пакет анализа» (см. Установка надстроек

Excel на компьютере.doc).


Top