Проверка выборки на однородность в excel

Обновлено: 05.07.2024

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зинюк Ольга Викторовна

В статье рассматривается методика проверки выборки на нормальность и расчета корреляционного отношения с использованием средств автоматизации обработки данных MS Excel и VBA, таких как создание макросов и пользовательских функций, с целью ее универсального использования в экономико-статистических исследованиях.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Зинюк Ольга Викторовна

Методика расчета ошибки и однородности выборки средствами MS Excel и VBA Формирование ассортимента обуви на базе экономико-статистического анализа выборок Оценка достоверности экспериментальных данных для биологической очистки сточных вод с использованием системы Statistica Описательная статистика с использованием пакетов статистических программ Statistica и SPSS i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

CHECK SAMPLE FOR THE NORMALITY AND CALCULATION CORRELATION RELATIONSHIPS IN MS EXCEL AND VBA

The article discusses method of test sample for the normality and calculate the correlation relationship with the use of automated data processing of MS Excel and VBA, such as creating macros and custom functions, with a view to its universal use in economy-statistical studies.

Текст научной работы на тему «Проверка выборки на нормальность и расчет корреляционного отношения в среде MS Excel и VBA»

ПРОВЕРКА ВЫБОРКИ НА НОРМАЛЬНОСТЬ И РАСЧЕТ КОРРЕЛЯЦИОННОГО ОТНОШЕНИЯ В СРЕДЕ MS EXCEL И VBA

Ольга Викторовна Зинюк

В статье рассматривается методика проверки выборки на нормальность и расчета корреляционного отношения с использованием средств автоматизации обработки данных MS Excel и VBA, таких как создание макросов и пользовательских функций, с целью ее универсального использования в экономико-статистических исследованиях.

Ключевые слова: нормальность выборки, корреляционное отношение, макрос, функция пользователя, медиана, эксцесс, коэффициент детерминации.

CHECK SAMPLE FOR THE NORMALITY AND CALCULATION CORRELATION RELATIONSHIPS IN MS EXCEL AND VBA

The article discusses method of test sample for the normality and calculate the correlation relationship with the use of automated data processing of MS Excel and VBA, such as creating macros and custom functions, with a view to its universal use in economy-statistical studies.

Keywords: normality, correlation relationship, macros, custom function, median, kurtosis, the coeffici ent of determination.

Совместный анализ выборок, полученных в результате экономико-статистических исследований, требует решения вопроса о выборе параметрических или непараметрических критериев статистики для оценки их взаимосвязи [1].

Выбор параметрических критериев методов математической статистики основывается на предположении о том, что распределение выборок подчиняется нормальному (гауссовому) закону распределения, в связи с чем одной из задач статистического анализа является проверка вида распределения выборок [2].

В работе представлена методика проверки выборки на нормальность и определения корреляционного отношения с использованием средств автоматизации расчетов MS Excel и VBA. Представленная методика дает возможность максимально автоматизировать операции расчета данных и может быть использована для выборок любого объема в статистических исследованиях, проводимых в любой области экономики.

2. Формирование исходной выборки

В качестве исходных данных рассматриваются выборки, полученных в результате сбора информации на сайте по количеству заказов обуви в течение 20 контрольных дней. Потребительским качествам и факторам обуви присвоены квалификационные коды для их использования в создании аналитических баз данных: КГГ - повышенная гигиеничность; КНП - снижение нагрузки на позвоночник; КОВ - обувь для водителей; КПВ - повышенная влагонепроницаемость; КПГ -повышенная гибкость; КПП - противоскользящая подошва; КСЭ - защита от статического электричества; КФС - форма подошвы, соответствующая стопе; ДАМ - аналоги известных марок; ДДК - дизайн-комфорт; ДМК - модная коллекция; ДНЗ - аналоги обуви знаменитостей; ДПК - перспективная коллекция; ЭВФ -высокая формоустойчивость; ЭНИ - низкая истираемость верха и низа; ЭПП -повышенная прочность; ЭЭЧ - экологическая чистота.

Полученная база данных, подготовленная к обработке с MS Excel, состоит из семнадцати выборок (по количеству факторов) и содержит номер измерения от 1 до 20 (по количеству дней), общее количество заказов в день (n) и количество заказов обуви по факторам (m) (таблица 2.1).

Таблица 2.1. Количество заказов обуви по измерениям (Лист «Исходные данные» - фрагмент)

A B C D E F G H I J K L M N O P Q R S

1 № измерения Количество заказов (и,) I 1-4 Ы | I ! 1 £ и va 1 Ьч & о и °о % « СЛ S v—✓ Е I PO S I « S Ji e и CD *-> S S X E a Я о jf Ж О

2 1 239 13 25 8 18 10 21 5 15 12 12 19 8 15 17 18 19 4

3 2 188 10 18 7 14 8 16 6 11 8 9 15 7 12 12 14 16 5

20 19 197 10 19 10 14 8 16 6 11 9 9 16 9 12 12 15 16 5

21 20 155 10 16 6 12 7 14 5 6 9 9 14 6 6 4 12 14 5

3. Проверка выборки на нормальность

Проверка распределения на нормальность включает следующие этапы [2]:

1) Вычисляются среднее арифметическое, медиана и мода. Если полученные значения друг от друга значительно не отличаются, мы имеем дело с нормальным распределением.

Формула для вычисления среднего арифметического (выборочного) - сумма значений переменной (х; . хп), деленная на п (число значений перемен-ной -

Экономика, Статистика и Информатика^! 109 №5, 2011

Медиана разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы, половина - выше. Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр.

Мода представляет собой максимально часто встречающееся значение пере-менной.

2) Вычисляется эксцесс - мера крутости кривой распределения, который для нормального распределения должен быть равен 0. Эксцесс определяется по уравнению:

Таблица 3.1. Формулы для расчета статистических параметров (Лист «Нормальность»)

1 Код фактора КГГ

22 Среднее =СРЗНАЧ(С2:С21)

23 Медиана =МЕДИАНА(С2:С21)

24 Мода =МОДА(С2:С21)

25 Эксцесс =ЭКСЦЕСС (С2:С21)

Рис. 1. Окно выбора аргументов функции «Normal»

где x - среднее значение переменной;

n - число значений перемен-ной; а - стандартное отклонение выборки.

Вычисление среднего, медианы, моды и эксцесса средствами MS Excel в режиме формул показано в таблице 3.1.

Для расчета абсолютных отклонений среднего значения от медианы и моды на VBA разработана пользовательская функция «Normal», аргументами которой являются среднее значение выборки (Sr) и медиана или мода (M):

Public Function Normal(Sr As Single, M As Single) Dim Nl As Single

Nl = Abs ( ( (Sr - M) / Sr) * 100) Normal = Nl End Function

При выборе функции для возможности ее последующего копирования в качестве аргументов вводятся относительные ссылки на ячейку C22 и C23, C24 (рисунок 1).

Анализ отклонений среднего значения от медианы и моды показывают, что перечисленные величины не совпадают (рисунок 2), а эксцесс кривой распределения отличен от 0 (рисунок 3).

Вышеперечисленные расчеты позволяют сделать вывод о том, что распределение рассматриваемых выборок не подчиняется нормальному (гауссо-вому) закону распределения и позволяют использовать для анализа только непараметрические критерии статистики, которые свободны от допущения о законе распределения выборок и бази-

Рис. 2. Отклонение среднего значения от медианы и моды

Рис. 3. Значение эксцесса кривой распределения

руются на предположении и независимости наблюдений.

4. корреляционный анализ

В эконометрических и экономико-математических моделях, применяемых, в частности, при изучении и оптимизации процессов маркетинга, наиболее популярно нормальное распределение, однако практика показывает, что в большинстве случаев распределения существенно отличаются от нормальных [3], в связи с чем для корреляционного анализа в работе рассматриваются только непараметрическое оценивание.

Для количественного анализа эффективности маркетинговых мероприятий необходимо установить зависимость между генеральной совокупностью (общим количеством заказов) и количеством заказов обуви по факторам.

Отсутствие нормальности выборок делает невозможным использование коэффициента корреляции, который предполагает наличие линейной связи между признаками. При наличии нелинейной связи коэффициент корреляции может быть равен нулю. В таких случаях для выявления связи применяют другой показатель - корреляционное отношение [2], которое фиксирует наличие любой связи между признаками. Алгоритм расчета корреляционного отношения включает следующие шаги:

- область значений одного признака (генеральной совокупности) разбивается на участки;

- для каждого из участков определяется среднее значение другого признака (пофакторной выборки);

- вычисляется корреляционное отношение, величина которого, как и коэффициента корреляции, лежит между нулем и единицей; чем ближе значение корреляционного отношения к единице, тем более тесной является связь.

Разработку методики расчета корреляционного отношения рассмотрим на примере установления зависимости между общим количество заказов обуви (п) и заказов по каждому из факторов комфортности (m.) - повышенной гигиеничности (КГГ) (таблица 1.1).

Произведем группировку общего количества заказов (факторный признак), образовав 5 групп с равными интервалами, предварительно отсортировав данные по количеству заказов.

Количество групп (5) выбрано на основании того, что в практике статистических исследований руководствуют-

ся тем, чтобы в интервалы попадало число наблюдений не менее 5-10 [3].

Величина интервала группировки (й) определяется как:

где n , n . - максимальное и ми-

нимальное значения общего количества заказов.

Границы интервалов групп nd определяются как:

Нижней границей первого интеграла является минимальное значение количества заказов n .

Для определения номера интервала на VBA разработана пользовательская функция «Interval», аргументами которой являются максимальное (nmax), минимальное (nmin) и текущее (Kz) количество заказов.

P>ublic Function Interval (nmax As Single, nmin As Single, Kz As Single) As Single Dim d As Single, II As Single d = (nmax - nmin) / 5

II = End If End If End If End If End If Interval = End Function

i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

При выборе функции для возмож-

ности ее последующего копирования в качестве аргументов вводятся абсолютные ссылки на ячейки $В$21 и $В$2 и относительная - на ячейку В2 (рисунок 4).

После сортировки и проведения расчетов в таблицу исходных результатов (таблица 1.1) добавляется столбец «№ интервала» (таблица 4.1).

Корреляционное отношение определяется по формуле:

где DMexp - межгрупповая диспер-

общ - общая дисперсия: D

D - внутригрупповая дисперсия:

т.ср - групповые пофакторные средние (по интервалам);

тр - общее пофакторное среднее; п. - количество заказов в группах; п - общее количество заказов; k - количество групп; D. - дисперсия в группе. Дисперсия в группе вычисляется по формуле: N

где mi - текущее значение;

N - число значений в группе.

Вышеперечисленные данные, рассчитанные с помощью промежуточных итогов в Excel, показаны на рисунке 5.

Для определения корреляционного отношения нецелесообразно создавать макросы и пользовательские функции, так как в расчетах необходимо в каче-

Рис. 4. Окно выбора аргументов функции «Interval»

Экономика, Статистика и Информатика

стве аргументов использовать относительные, смешанные и абсолютные ссылки и нефиксированный диапазон данных. В связи с этим проведение вычислений с помощью переадресации, встроенных функций и групповых операций MS Excel [4] дает больший эффект автоматизации расчетов.

Полученные данные (рисунок 5) сводятся в единую таблицу (рисунок 6) для проведения расчета межгрупповой, общей, внутренней дисперсии и корреляционного отношения (формулы 4.3-4.6).

Графический анализ пофакторного коэффициента корреляционного отношения (рисунок 7) показывает, что ряд одних факторов имеют высокую (0,70,9) и весьма высокую (0,9-0,99) по шкале Чеддока [1] функциональную связь с общим количеством заказов, в то время как другие - умеренную и заметную (0,3-0,7).

Фрагмент расчетной таблицы (рисунок 6) в режиме отображения формул показан в таблице 4.2.

При значениях показателей тесноты связи меньше 0,7 величина коэффициента детерминации [3] всегда будет ниже 50 %. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя (общего количества заказов обуви).

Таки образом, формирование маркетинговой политики и построение регрессионных моделей необходимо про-

Таблица 4.1. Расчет интервалов групп по количеству заказов (Лист «Корреляционное отношение» - фрагмент)

A B C D E F G H I J K L M N O P Q R S T

1 0 1 а Количество заказов (и,) I и ы I С «Ч Е И § •» Е И £ 1 к S СП о и £ £ Е i JN & & ЭВФ (т14,) I Я К т I И С О I £ О о № интервала


В отчетах об оценке оценщиками за частую проводится проверка выборки на однородность с помощью коэффициента вариации (пресловутые 33%). На мой взгляд, такая проверка не может служить критерием однородности или неоднородности выборки. Может быть я и не прав, но какого-либо крепкого обоснования такому способу проверки я пока не встречал. Интересно, что думают и какие доводы в защиту такого способа проверки могут привести коллеги!

Комментарии 20


Читая "Методические рекомендации по составлению, актуализации и экспертизе отчетов об оценке объектов недвижимого имущества, изымаемых в целях размещения олимпийских объектов федерального значения и (или) предоставляемых в рамках Федерального закона № 310-ФЗ, включающих расчет платы за установление сервитута и (или) расчет размера убытков, подлежащих возмещению правообладателям объектов недвижимости в связи с их изъятием, или в связи с установлением сервитута" случайно нашел в тексте ссылку на источник этой проверки "С.В. Грибовский, С.А. Сивец «Математические методы оценки стоимости недвижимости» (М.: Финансы и статистика, 2008)". Может у кого-то из коллег есть этот учебник? Очень бы хотелось узнать, какое обоснование этой проверке приводят авторы этого учебника. Может кто-то может сделать скан страниц учебника, на которых говорится об этой проверке (и прислать, либо разместить в этой теме)?


Собственно нашел учебник, а тут опять разочарование. Никаких объяснений этой проверке в нем не приводится. Похоже, его и нет. Порыскав в серьезных учебниках по прикладной статистике - тоже ничего не нашел.


Проверить, что выборка однородна, нельзя вообще. Однородность означает, что в выборке представлены значения только одной случайной величины. Но эта величина может иметь какое угодно распределение. Другое дело, что можно разделить выборку, например, на несколько по какому-то признаку, а затем проверять, что все подвыборки имеют одно и то же распределение. Для этого используются совсем другие критерии.



Уже обсуждали этот вопрос. Однородность выборки, очень качественный показатель. Открытым остается вопрос как ее оценивать? Свой подход разбивки массовой выборки на однородные фрагменты уже излагал и не буду повторятся.

А встречается проверка на однородность в виде допуска в методике Минюста для автомобилей, в 40 статье налогового Кодекса для оценки полноты уплаты налогов, в СП «Градостроительство» для точности измерения отдельных показателей.

Так что истоки есть и вопрос только в качественном подходе к измерению однородности, часто встречающийся в отчетах действительно не всегда корректен из-за ограниченного числа показателей определяющих понятие однородность.


Уже обсуждали этот вопрос. Однородность выборки, очень качественный показатель. Открытым остается вопрос как ее оценивать? Свой подход разбивки массовой выборки на однородные фрагменты уже излагал и не буду повторятся.

Ваш подход, как я его понял, полностью соответствует тому, что об однородности пишет и С.А. Смоляк и что имею виду "под однородностью" я. Вы по сути, задаете набор требуемых критериев и проводите отсев по ним. Тем самым получаете однородную (с точки зрения соответствия заданным параметрам) выборку.

Вопрос оценивания однородности выборки для меня прост: выборка может быть либо однородной, либо нет. Соответственно если элементы выборки удовлетворяют определенным для её элементам критериям (например, на принадлежность к четко очерченному рынку) - то она однородна, если нет - то нет. Вопрос в том, что понимают под однородностью оценщики, которые в своих отчетах проводят "тест на однородность на основе коэффициента вариации".


Егор, подскажите, Вы решили свой вопрос с коэффициентом вариации? Каковво Ваше итоговое заключение в этом вопросе?


Коэффициент вариации - не может быть критерием однородности выборки (во всяком случае сам по себе). Мы можем отобрать в качестве аналогов объекты, которые ими не являются (например, с разных сегментов рынка) - но с низкой вариацией скорректированных цен, и наоборот, мы можем использовать аналоги на рынке, например, с высокой волатильностью и низкой ликвидностью, которые дадут нам на выходе высокую вариацию скорректированных цен.

Коэффициент вариации скорректированных цен отражает ту часть вариации цен, которая не может быть объяснена оценщиком в том числе и по объективным (не зависящим от него) причинам, связанным с характеристиками исследуемого рынка.. Для низковолатильных, высоколиквидных и прозрачных рынков - вариация цен, обусловленная характеристиками самого рынка, может быть меньше, для высоковолатильных, низколиквидных и непрозрачных - больше, все это может находить отражение в коэффициентах вариации скорректированных цен, полученных оценщиком в выборках аналогов при оценке объектов на различных рынках. Поэтому какого-то определенного волшебного числа (например, 33%), в сравнении с которым мы можем сделать вывод об однородности или неоднородности выборки - не существует. На одних рынках коэффициент вариации скорректированных цен в размере 20% может намекать нам на возможную нерепрезентативность выборки, на других 35% могут выглядеть вполне естественными.


1 июня 2017 в 11:10:16 (отредактировано 36 минут спустя)

Попалось тут на тему.

Это я применительно к случаю из практики.

Надо было 3 десятка ЗУ в КП ДНП оценить.

В ближ окрестностях продавались 15 "подозрительно похожих". 7 ДНП и 8 ИЖС.

Визуально, на зависимости удельной цены от площади не было ни зависимости удельной цены от площади, ни различий по ВРИ. Средняя ошибка от среднего +/- 6%.

Получили жалобу с аргументом, что завышено, поскольку подмешаны некорректные аналоги ИЖС.

Дабы не накалять, переоценили только по аналогам ДНП и типа отвалите. Правда итог на неск. % стал больше.

Причём, мне результат оценки 30 ЗУ, полученный на 7 аналогах, нравится меньше, чем на 15.

Может, надо было чего про однородность дебилам рассказать? Хотя, наверное, бесполезно, коли глазам не верят.


30 июня 2017 в 20:23:15 (отредактировано 38 минут спустя)

Ой, зря Вы меня пригласили на этот междусобойчик. я же еще тот ругатель.

Честно говоря, даже и не знаю, к кому обращаться.

И конечно, по значению этого (единичного) показателя о форме распределения, а тем более, о наиболее (родной) вероятной величине (читай скрижали –ФЗ-135) мы ничего не можем сказать, если мы не предпримем предположение о НОРМАЛЬНОМ распределении (а отсюда и лакомые 33% и т.п.), что само по себе – это предположение – является ненормальным. Ну, во-первых, потому, что распределение РС в своих границах всегда конечно, во вторых, все мы знаем (интуитивно), что максимум плотности значений РС всегда близок (но не совпадает) с минимальной границей абсолютных значений, а к максимуму абсолютных значений движется «хвост» убывающей плотности .

Т.е. ,казалось бы, есть смысл исследовать и ассиметрию и эксцесс, но .

Вам то что надо? Получить достоверный результат, понять что и как происходит, или удовлетворить хотелки заказчика?

По второму варианту Вам уже алгоритм прописан:

"Первое – выбираются критерии сравнения."

Это – о ценообразующих факторах - вид на помойку или рядом с метро (т.е. сложили мягкое с треугольным и . ага!). Тут понятно. Все – «по икспердному мнению» спеца

"Второе – все по критериям в эксель."

Без комментариев. По опросам на втором месте посещаемости вебинаров после « как вести себя в суде» стоит « как работать в эксель»

" Третье – изучение факторов влияния."

Уг. См. пункт первый

"Четвертое – составление формулы сравнения для вычленения отдельных рынков и туфты (составление формулы сравнимого фактора) ."

Ну, тут можно блеснуть и верхней математикой.

Против таблицы умножения в развернутой форме не попрешь.

"Пятое – сортировка данных по фактору. "

И опять – по каким критериям – по икспердному мнению?

"После вычленения рынков в выборке, решается вопрос, а на каком объект оценки?"

В целЯх природы обуздания

В целЯх рассеять неученья тьму

Беру картину мироздания –да

И тупо смОтрю что к чему

Замечание: я отслеживаю по рынку Е-бурга порядка 12 000 (двенадцати тысяч) объектов только жилья (а еще офисы, магазины. ) ежемесячно, а оценщик вылистывает от силы пять. (штук)

"Проделайте эту процедуру и отклонения более 5% не получите, так для контроля."

"Поэтому и не заморачиваю"

Поэтому и вопрос – вы хотите не заморачиваться и сдать "красивую" работу с фрагментами "верхней" математтики, типа "проверкивыборки" или хотите получить достоверный результат?

Ошибка средней арифметической в Microsoft Excel

Стандартная ошибка или, как часто называют, ошибка средней арифметической, является одним из важных статистических показателей. С помощью данного показателя можно определить неоднородность выборки. Он также довольно важен при прогнозировании. Давайте узнаем, какими способами можно рассчитать величину стандартной ошибки с помощью инструментов Microsoft Excel.

Расчет ошибки средней арифметической

Одним из показателей, которые характеризуют цельность и однородность выборки, является стандартная ошибка. Эта величина представляет собой корень квадратный из дисперсии. Сама дисперсия является средним квадратном от средней арифметической. Средняя арифметическая вычисляется делением суммарной величины объектов выборки на их общее количество.

В Экселе существуют два способа вычисления стандартной ошибки: используя набор функций и при помощи инструментов Пакета анализа. Давайте подробно рассмотрим каждый из этих вариантов.

Способ 1: расчет с помощью комбинации функций

Прежде всего, давайте составим алгоритм действий на конкретном примере по расчету ошибки средней арифметической, используя для этих целей комбинацию функций. Для выполнения задачи нам понадобятся операторы СТАНДОТКЛОН.В, КОРЕНЬ и СЧЁТ.

Для примера нами будет использована выборка из двенадцати чисел, представленных в таблице.

Выборка в Microsoft Excel

  1. Выделяем ячейку, в которой будет выводиться итоговое значение стандартной ошибки, и клацаем по иконке «Вставить функцию».

Переход в Мастер функций в Microsoft Excel

Переход в окно аргументов функции СТАНДОТКЛОН.В в Microsoft Excel

«Число1» и последующие аргументы являются числовыми значениями или ссылками на ячейки и диапазоны листа, в которых они расположены. Всего может насчитываться до 255 аргументов этого типа. Обязательным является только первый аргумент.

Окно аргументов функции СТАНДОТКЛОН.В в Microsoft Excel

Переход к дальнейшему продолжению написания формулы стандартной ошибки в Microsoft Excel

Переход в окно аргументов функции КОРЕНЬ в Microsoft Excel

Как видим, функция имеет всего один аргумент «Число». Он может быть представлен числовым значением, ссылкой на ячейку, в которой оно содержится или другой функцией, вычисляющей это число. Последний вариант как раз и будет представлен в нашем примере.

Окно аргументов функции КОРЕНЬ в Microsoft Excel

Переход в окно аргументов функции СЧЁТ в Microsoft Excel

Окно аргументов функции СЧЁТ в Microsoft Excel

Результат вычисления стандартной ошибки в сложной формуле в Microsoft Excel

Но дело в том, что для малых выборок (до 30 единиц) для большей точности лучше применять немного измененную формулу. В ней величина стандартного отклонения делится не на квадратный корень от количества элементов выборки, а на квадратный корень от количества элементов выборки минус один. Таким образом, с учетом нюансов малой выборки наша формула приобретет следующий вид:

Результат вычисления стандартной ошибки для малой выборки в Microsoft Excel

Способ 2: применение инструмента «Описательная статистика»

Вторым вариантом, с помощью которого можно вычислить стандартную ошибку в Экселе, является применение инструмента «Описательная статистика», входящего в набор инструментов «Анализ данных» («Пакет анализа»). «Описательная статистика» проводит комплексный анализ выборки по различным критериям. Одним из них как раз и является нахождение ошибки средней арифметической.

Но чтобы воспользоваться данной возможностью, нужно сразу активировать «Пакет анализа», так как по умолчанию в Экселе он отключен.

    После того, как открыт документ с выборкой, переходим во вкладку «Файл».

Переход во вкладку Файл в Microsoft Excel

Перемещение в раздел Параметры в Microsoft Excel

Переход в подраздел надстройки окна параметров в Microsoft Excel

Переход в окно надстроек в Microsoft Excel

Включение пакета анализа в окне надстроек в Microsoft Excel

Переход во вкладку Данные в Microsoft Excel

Переход в Анализ данных в Microsoft Excel

Переход в описательную статистику в Microsoft Excel

В блоке «Группирование» оставляем настройки по умолчанию. То есть, переключатель должен стоять около пункта «По столбцам». Если это не так, то его следует переставить.

Галочку «Метки в первой строке» можно не устанавливать. Для решения нашего вопроса это не важно.

Далее переходим к блоку настроек «Параметры вывода». Здесь следует указать, куда именно будет выводиться результат расчета инструмента «Описательная статистика»:

  • На новый лист;
  • В новую книгу (другой файл);
  • В указанный диапазон текущего листа.

Давайте выберем последний из этих вариантов. Для этого переставляем переключатель в позицию «Выходной интервал» и устанавливаем курсор в поле напротив данного параметра. После этого клацаем на листе по ячейке, которая станет верхним левым элементом массива вывода данных. Её координаты должны отобразиться в поле, в котором мы до этого устанавливали курсор.

Далее следует блок настроек определяющий, какие именно данные нужно вводить:

  • Итоговая статистика;
  • К-ый наибольший;
  • К-ый наименьший;
  • Уровень надежности.

Для определения стандартной ошибки обязательно нужно установить галочку около параметра «Итоговая статистика». Напротив остальных пунктов выставляем галочки на свое усмотрение. На решение нашей основной задачи это никак не повлияет.

Окно описаительная статистика в Microsoft Excel

Результат расчета стандартной ошибки путем применения инструмента Описательная статистика в Microsoft Excel

Как видим, в Экселе можно произвести расчет стандартной ошибки двумя способами: применив набор функций и воспользовавшись инструментом пакета анализа «Описательная статистика». Итоговый результат будет абсолютно одинаковый. Поэтому выбор метода зависит от удобства пользователя и поставленной конкретной задачи. Например, если ошибка средней арифметической является только одним из многих статистических показателей выборки, которые нужно рассчитать, то удобнее воспользоваться инструментом «Описательная статистика». Но если вам нужно вычислить исключительно этот показатель, то во избежание нагромождения лишних данных лучше прибегнуть к сложной формуле. В этом случае результат расчета уместится в одной ячейке листа.

Закрыть

Мы рады, что смогли помочь Вам в решении проблемы.

Отблагодарите автора, поделитесь статьей в социальных сетях.

Закрыть

Опишите, что у вас не получилось. Наши специалисты постараются ответить максимально быстро.

Критерий Стьюдента в Microsoft Excel

Одним из наиболее известных статистических инструментов является критерий Стьюдента. Он используется для измерения статистической значимости различных парных величин. Microsoft Excel обладает специальной функцией для расчета данного показателя. Давайте узнаем, как рассчитать критерий Стьюдента в Экселе.

Определение термина

Но, для начала давайте все-таки выясним, что представляет собой критерий Стьюдента в общем. Данный показатель применяется для проверки равенства средних значений двух выборок. То есть, он определяет достоверность различий между двумя группами данных. При этом, для определения этого критерия используется целый набор методов. Показатель можно рассчитывать с учетом одностороннего или двухстороннего распределения.

Расчет показателя в Excel

Способ 1: Мастер функций

Проще всего производить вычисления данного показателя через Мастер функций.

    Строим таблицу с двумя рядами переменных.

Два ряда аргументов в Microsoft Excel

Переход в мастер функций в Microsoft Excel

Функция СТЬЮДЕНТ.ТЕСТ в Microsoft Excel

В поле «Хвосты» вписываем значение «1», если будет производиться расчет методом одностороннего распределения, и «2» в случае двухстороннего распределения.

В поле «Тип» вводятся следующие значения:

  • 1 – выборка состоит из зависимых величин;
  • 2 – выборка состоит из независимых величин;
  • 3 – выборка состоит из независимых величин с неравным отклонением.

Аргументы функции СТЬЮДЕНТ.ТЕСТ в Microsoft Excel

Выполняется расчет, а результат выводится на экран в заранее выделенную ячейку.

Результат функции СТЬЮДЕНТ.ТЕСТ в Microsoft Excel

Способ 2: работа со вкладкой «Формулы»

Функцию СТЬЮДЕНТ.ТЕСТ можно вызвать также путем перехода во вкладку «Формулы» с помощью специальной кнопки на ленте.

    Выделяем ячейку для вывода результата на лист. Выполняем переход во вкладку «Формулы».

Переход во вкладку фоормулы в Microsoft Excel

Переход к функции СТЬЮДЕНТ.ТЕСТ в Microsoft Excel

Форма аргументов функции СТЬЮДЕНТ.ТЕСТ в Microsoft Excel

Способ 3: ручной ввод

Формулу СТЬЮДЕНТ.ТЕСТ также можно ввести вручную в любую ячейку на листе или в строку функций. Её синтаксический вид выглядит следующим образом:

Что означает каждый из аргументов, было рассмотрено при разборе первого способа. Эти значения и следует подставлять в данную функцию.

Ручной ввод функции СТЬЮДЕНТ.ТЕСТ в Microsoft Excel

После того, как данные введены, жмем кнопку Enter для вывода результата на экран.

Результат ручного ввода функции СТЬЮДЕНТ.ТЕСТ в Microsoft Excel

Как видим, вычисляется критерий Стьюдента в Excel очень просто и быстро. Главное, пользователь, который проводит вычисления, должен понимать, что он собой представляет и какие вводимые данные за что отвечают. Непосредственный расчет программа выполняет сама.

Закрыть

Мы рады, что смогли помочь Вам в решении проблемы.

Отблагодарите автора, поделитесь статьей в социальных сетях.

Закрыть

Опишите, что у вас не получилось. Наши специалисты постараются ответить максимально быстро.

Читайте также: