Квантиль распределения стьюдента в excel

Обновлено: 07.07.2024

Функция СТЮДРАСПОБР предназначена для расчета значения квантиля уровня, соответствующего известной вероятности (указывается в качестве первого аргумента), распределения Стьюдента для известных степеней свободы и возвращает обратное t-распределение.

Распределение Стьюдента и нормальное распределение в Excel

Рассматриваемая функция возвращает значение t, соответствующее условию P(|x|>t)=p. Здесь x является значением некоторой случайной величины с распределением Стьюдента, у которого число степеней свобод соответствует k (второй аргумент функции СТЮДРАСПОБР).

  1. Распределение Стьюдента является одним из видов распределения случайной величины, близкое к нормальному распределению с характерным отличием – сниженная концентрацией отклонений в средней части распределения. Иное название – t-распределение.
  2. Квантилем считается некоторое значение, которое с определенной вероятностью (фиксированной) не будет превышено случайной величиной.
  3. Функция СТЮДРАСПОБР считается устаревшей начиная с версии MS Office 2010. Она оставлена для обеспечения совместимости с другими табличными редакторами и документами, созданными в более старых версиях табличного редактора. В новых версиях следует использовать усовершенствованные аналоги: СТЬЮДЕНТ.ОБР.2Х или СТЬЮДЕНТ.ОБР.

Ниже рассмотрим примеры использования функции СТЮДРАСПОБР в Excel.

Определение одностороннего и двустороннего t распределение Стьюдента

Пример 1. Определить односторонне и двустороннее t-значения для распределения Стьюдента, характеризующееся вероятностью 0,17 и числом степени свобод 16.

Вид таблицы данных:

Пример 1.

Для расчета двустороннего t-значения используем функцию:

СТЬЮДРАСПОБР.

Для двустороннего t используем удвоенное значение вероятности:

В результате получим:

Определение двустороннего t распределение.

Число степеней свободы в распределении Стьюдента

Пример 2. Сгенерировать 8 случайных чисел с использованием функции СЛЧИС, для которых распределение Стьюдента имеет 4 степени свободы.

Поскольку вероятность того, что случайна величина примет как отрицательное, так и положительное значение является одинаковой и равна 0,5 (распределение Стьюдента симметрично относительно вертикальной оси графика), используем функцию ЕСЛИ для проверки значений.

Выделим 8 ячеек и запишем следующую функцию (вводить как формулу массива CTRL+SHIFT+Enter):

То есть, если случайное значение вероятности, сгенерированное функцией СЛЧИС меньше 0,5, будет сгенерировано отрицательное t-значение, иначе – положительное.

Понятие Квантиля основано на определении Функции распределения . Поэтому, перед изучением Квантилей рекомендуем освежить в памяти понятия из статьи Функция распределения вероятности .

  • Определение
  • Квантили специальных видов
  • Квантили стандартного нормального распределения
  • Квантили распределения Стьюдента
  • Квантили распределения ХИ-квадрат
  • Квантили F-распределения
  • Квантили распределения Вейбулла
  • Квантили экспоненциального распределения

Сначала дадим формальное определение квантиля, затем приведем примеры их вычисления в MS EXCEL.

Определение


Пусть случайная величина X , имеет функцию распределения F ( x ). α-квантилем ( альфа- квантиль, x a , квантиль порядка α, нижний α- квантиль ) называют решение уравнения x a =F -1 (α), где α - вероятность, что случайная величина х примет значение меньшее или равное x a , т.е. Р(х файл примера Лист Определение ):

Примечание : О построении графиков в MS EXCEL можно прочитать статью Основные типы диаграмм в MS EXCEL .

Например, с помощью графика вычислим 0,21-ю квантиль , т.е. такое значение случайной величины, что Р(X НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР(), ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье Распределения случайной величины в MS EXCEL .

Точное значение квантиля в нашем случае можно найти с помощью формулы =НОРМ.СТ.ОБР(0,21)

СОВЕТ : Процедура вычисления квантилей имеет много общего с вычислением процентилей выборки (см. статью Процентили в MS EXCEL ).

Квантили специальных видов

Часто используются Квантили специальных видов:


В качестве примера вычислим медиану (0,5-квантиль) логнормального распределения LnN(0;1) (см. файл примера лист Медиана ).

Это можно сделать с помощью формулы =ЛОГНОРМ.ОБР(0,5; 0; 1)

Квантили стандартного нормального распределения

Необходимость в вычислении квантилей стандартного нормального распределения возникает при проверке статистических гипотез и при построении доверительных интервалов.

Примечание : Про проверку статистических гипотез см. статью Проверка статистических гипотез в MS EXCEL . Про построение доверительных интервалов см. статью Доверительные интервалы в MS EXCEL .

В данных задачах часто используется специальная терминология:

  • Нижний квантиль уровняальфа ( α percentage point) ;
  • Верхний квантиль уровня альфа (upper α percentage point) ;
  • Двусторонние квантили уровняальфа .

Нижний квантиль уровня альфа - это обычный α-квантиль. Чтобы пояснить название « нижний» квантиль , построим график плотности вероятности и функцию вероятности стандартного нормального распределения (см. файл примера лист Квантили ).



Выделенная площадь на рисунке соответствует вероятности, что случайная величина примет значение меньше α-квантиля . Из определения квантиля эта вероятность равна α . Из графика функции распределения становится понятно, откуда происходит название " нижний квантиль" - выделенная область расположена в нижней части графика.

Для α=0,05, нижний 0,05-квантиль стандартного нормального распределения равен -1,645. Вычисления в MS EXCEL можно сделать по формуле:

Однако, при проверке гипотез и построении доверительных интервалов чаще используется "верхний" α-квантиль. Покажем почему.

Верхним α - квантилем называют такое значение x α , для которого вероятность, того что случайная величина X примет значение больше или равное x α равна альфа: P(X>= x α )= α . Из определения понятно, что верхний альфа - квантиль любого распределения равен нижнему (1- α) - квантилю. А для распределений, у которых функция плотности распределения является четной функцией, верхний α - квантиль равен нижнему α - квантилю со знаком минус . Это следует из свойства четной функции f(-x)=f(x), в силу симметричности ее относительно оси ординат.

Действительно, для α=0,05, верхний 0,05-квантиль стандартного нормального распределения равен 1,645. Т.к. функция плотности вероятности стандартного нормального распределения является четной функцией, то вычисления в MS EXCEL верхнего квантиля можно сделать по двум формулам:

Чтобы пояснить название « верхний» квантиль , построим график плотности вероятности и функцию вероятности стандартного нормального распределения для α=0,05.



Выделенная площадь на рисунке соответствует вероятности, что случайная величина примет значение больше верхнего 0,05-квантиля , т.е. больше значения 1,645. Эта вероятность равна 0,05.

На графике плотности вероятности площадь выделенной области равна 0,05 (5%) от общей площади под графиком (равна 1). Из графика функции распределения становится понятно, откуда происходит название "верхний" квантиль - выделенная область расположена в верхней части графика. Если Z 0 больше верхнего квантиля , т.е. попадает в выделенную область, то нулевая гипотеза отклоняется.

Также при проверке двухсторонних гипотез и построении соответствующих доверительных интервалов иногда используется понятие "двусторонний" α-квантиль. В этом случае условие отклонения нулевой гипотезы звучит как |Z 0 |>Z α /2 , где Z α /2верхний α/2-квантиль . Чтобы не писать верхний α/2-квантиль , для удобства используют "двусторонний" α-квантиль. Почему двусторонний? Как и в предыдущих случаях, построим график плотности вероятности стандартного нормального распределения и график функции распределения .



Невыделенная площадь на рисунке соответствует вероятности, что случайная величина примет значение между нижним квантилем уровня α /2 и верхним квантилем уровня α /2, т.е. будет между значениями -1,960 и 1,960 при α=0,05. Эта вероятность равна в нашем случае 1-(0,05/2+0,05/2)=0,95. Если Z 0 попадает в одну из выделенных областей, то нулевая гипотеза отклоняется.

Вычислить двусторонний 0,05 - квантиль это можно с помощью формул MS EXCEL: =НОРМ.СТ.ОБР(1-0,05/2) или =-НОРМ.СТ.ОБР(0,05/2)

Другими словами, двусторонние α-квантили задают интервал, в который рассматриваемая случайная величина попадает с заданной вероятностью α.

Квантили распределения Стьюдента

Аналогичным образом квантили вычисляются и для распределения Стьюдента . Например, вычислять верхний α/2- квантиль распределения Стьюдента с n -1 степенью свободы требуется, если проводится проверка двухсторонней гипотезы о среднем значении распределения при неизвестной дисперсии ( см. эту статью ).

Для верхних квантилей распределения Стьюдента часто используется запись t α/2,n-1 . Если такая запись встретилась в статье про проверку гипотез или про построение доверительного интервала , то это именно верхний квантиль .

Примечание : Функция плотности вероятности распределения Стьюдента , как и стандартного нормального распределения , является четной функцией.

Чтобы вычислить в MS EXCEL верхний 0,05/2 - квантиль для t-распределения с 10 степенями свободы (или тоже самое двусторонний 0,05-квантиль ), необходимо записать формулу =СТЬЮДЕНТ.ОБР.2Х(0,05; 10) или =СТЬЮДРАСПОБР(0,05; 10) или =СТЬЮДЕНТ.ОБР(1-0,05/2; 10) или =-СТЬЮДЕНТ.ОБР(0,05/2; 10)

.2X означает 2 хвоста, т.е. двусторонний квантиль .

Квантили распределения ХИ-квадрат

Вычислять квантили распределения ХИ-квадрат с n -1 степенью свободы требуется, если проводится проверка гипотезы о дисперсии нормального распределения (см. статью Проверка статистических гипотез в MS EXCEL о дисперсии нормального распределения ).

При проверке таких гипотез также используются верхние квантили. Например, при двухсторонней гипотезе требуется вычислить 2 верхних квантиля распределения ХИ 2 : χ 2 α/2,n-1 и χ 2 1- α/2,n-1 . Почему требуется вычислить два квантиля , не один, как при проверке гипотез о среднем , где используется стандартное нормальное распределение или t-распределение ?

Дело в том, что в отличие от стандартного нормального распределения и распределения Стьюдента , плотность распределения ХИ 2 не является четной (симметричной относительно оси х). У него все квантили больше 0, поэтому верхний альфа-квантиль не равен нижнему (1-альфа)-квантилю или по-другому: верхний альфа-квантиль не равен нижнему альфа-квантилю со знаком минус.

Чтобы вычислить верхний 0,05/2 - квантиль для ХИ 2 -распределения с числом степеней свободы 10, т.е. χ 2 0,05/2,n-1 , необходимо в MS EXCEL записать формулу =ХИ2.ОБР.ПХ(0,05/2; 10) или =ХИ2.ОБР(1-0,05/2; 10)

Результат равен 20,48. .ПХ означает правый хвост распределения, т.е. тот который расположен вверху на графике функции распределения .

Чтобы вычислить верхний (1-0,05/2)- квантиль при том же числе степеней свободы , т.е. χ 2 1-0,05/2,n-1 и необходимо записать формулу =ХИ2.ОБР.ПХ(1-0,05/2; 10) или =ХИ2.ОБР(0,05/2; 10)

Результат равен 3,25.

Квантили F-распределения

Вычислять квантили распределения Фишера с n 1 -1 и n 2 -1 степенями свободы требуется, если проводится проверка гипотезы о равенстве дисперсий двух нормальных распределений (см. статью Двухвыборочный тест для дисперсии: F-тест в MS EXCEL ).

При проверке таких гипотез используются, как правило, верхние квантили. Например, при двухсторонней гипотезе требуется вычислить 2 верхних квантиля F -распределения: F α/2,n1-1, n 2 -1 и F 1-α/2,n1-1, n 2 -1 . Почему требуется вычислить два квантиля , не один, как при проверке гипотез о среднем ? Причина та же, что и для распределения ХИ 2 – плотность F-распределения не является четной . Эти квантили нельзя выразить один через другой как для стандартного нормального распределения . Верхний альфа-квантиль F -распределения не равен нижнему альфа-квантилю со знаком минус.

Чтобы вычислить верхний 0,05/2-квантиль для F -распределения с числом степеней свободы 10 и 12, необходимо записать формулу =F.ОБР.ПХ(0,05/2;10;12) =FРАСПОБР(0,05/2;10;12) =F.ОБР(1-0,05/2;10;12)

Результат равен 3,37. .ПХ означает правый хвост распределения, т.е. тот который расположен вверху на графике функции распределения .

Квантили распределения Вейбулла


Иногда обратная функция распределения может быть представлена в явном виде с помощью элементарных функций, например как для распределения Вейбулла . Напомним, что функция этого распределения задается следующей формулой:


После логарифмирования обеих частей выражения, выразим x через соответствующее ему значение F(x) равное P:

Примечание : Вместо обозначения α-квантиль может использоваться p - квантиль. Суть от этого не меняется.

Это и есть обратная функция, которая позволяет вычислить P - квантиль ( p - quantile ). Для его вычисления в формуле нужно подставить известное значение вероятности P и вычислить значение х p (вероятность того, что случайная величина Х примет значение меньше или равное х p равна P).

Квантили экспоненциального распределения


Задача : Случайная величина имеет экспоненциальное распределение :

Требуется выразить p -квантиль x p через параметр распределения λ и заданную вероятность p .

Примечание : Вместо обозначения α-квантиль может использоваться p-квантиль . Суть от этого не меняется.

Решение : Вспоминаем, что p -квантиль – это такое значение x p случайной величины X, для которого P(X

СОВЕТ : Для построения Доверительного интервала нам потребуется знание следующих понятий:

  • дисперсия и стандартное отклонение ,
  • выборочное распределение статистики ,
  • стандартная ошибка ,
  • уровень доверия/ уровень значимости ,
  • нормальное распределение , распределение Стьюдента и его квантили .

Формулировка задачи. Предположим, что из генеральной совокупности имеющей нормальное (или приблизительно нормальное ) распределение взята выборка размера n. Предполагается, что стандартное отклонение σ (или дисперсия σ 2 ) этого распределения неизвестно. Необходимо на основании этой выборки оценить неизвестное среднее значение распределения (μ, математическое ожидание ) и построить двухсторонний доверительный интервал .

Т.к. в этой задаче стандартное отклонение не известно, то вместо σ нужно использовать его оценку – стандартное отклонение выборки s, и, соответственно, вместо стандартного отклонения выборочного среднего использовать стандартную ошибку =s/КОРЕНЬ(n) .

Напомним, что в вышеуказанной статье про доверительный интервал при известном стандартном отклонении , для вычисления вероятностей мы использовали статистику Хср (среднее выборки) , которая, согласно ЦПТ , имеет нормальное или приблизительно нормальное распределение . Нам был известен один из его параметров: стандартное отклонение =σ/КОРЕНЬ(n) . Доверительный интервал рассчитывался относительно точечной оценки - Хср .


Если стандартное отклонение неизвестно, то для построения доверительного интервала вместо статистики Хср необходимо использовать статистику .


Как было показано в статье Статистики, выборочное распределение и точечные оценки в MS EXCEL выборочное распределение статистики будет стремиться к распределению Стьюдента с n-1 степенью свободы, где n – размер выборки .

Вспомним вероятностное утверждение, которое мы использовали для формирования доверительного интервала в случае с известным σ: «Вероятность того, что среднее генеральной совокупности находится в пределах 1,960 « стандартных отклонений выборочного среднего» от среднего выборки , равна 95%».

Примечание : Значение вероятности, упомянутое в утверждении, имеет специальное название уровень доверия , который связан с уровнем значимости α простым выражением Уровень доверия = 1 - α . В нашем случае уровень значимости α =1-0,95=0,05 .

Значение 1,960 – это верхний квантиль стандартного нормального распределения, соответствующий уровню значимости 5% (1-95%) . В нашем случае его нужно заменить на верхний (двухсторонний) квантиль распределения Стьюдента с n-1 степенью свободы t α/2,n-1 .

Чтобы вычислить этот квантиль в MS EXCEL необходимо записать формулу =СТЬЮДЕНТ.ОБР.2Х(0,05;n-1) или =СТЬЮДЕНТ.ОБР(1-0,05/2; n-1) или =-СТЬЮДЕНТ.ОБР(0,05/2; n-1)

При одном и том же уровне значимости, t-распределение будет давать более широкий доверительный интервал, чем стандартное нормальное распределение, т.к. у нас теперь меньше информации из-за того, что вместо σ мы использовали ее оценку s.


Теперь запишем соответствующую формулу для определения двухстороннего доверительного интервала :

Примечание : Верхний α/2-квантиль определяет ширину доверительного интервала в стандартных ошибках. Верхний α /2- квантиль распределения Стьюдента всегда больше 0, что очень удобно. Обычно при построении доверительных интервалов для оценки среднего используют только верхний α /2- квантиль и не используют нижний α /2- квантиль .

Это возможно потому, что распределение Стьюдента симметрично относительно оси х ( плотность его распределения симметрична относительно среднего, т.е. 0 ) . Поэтому,нет нужды вычислять нижний α /2-квантиль (его называют просто α /2-квантиль ), т.к. он равен верхнему α /2- квантилю со знаком минус.

В файле примера на листе Сигма неизвестна создана форма для расчета и построения двухстороннего доверительного интервала .


СОВЕТ : О построении других доверительных интервалов см. статью Доверительные интервалы в MS EXCEL .

Функция ДОВЕРИТ.СТЬЮДЕНТ()

Если значения выборки находятся в диапазоне B20:B79 , а уровень значимости равен 0,05; то формула MS EXCEL: =СРЗНАЧ(B20:B79)- ДОВЕРИТ.СТЬЮДЕНТ(0,05; СТАНДОТКЛОН.В(B20:B79); СЧЁТ(B20:B79)) вернет левую границу доверительного интервала .

Эту же границу можно вычислить с помощью формулы: =СРЗНАЧ(B20:B79)- СТЬЮДЕНТ.ОБР(1-0,05/2; СЧЁТ(B20:B79)-1)* СТАНДОТКЛОН.В(B20:B79)/ КОРЕНЬ(СЧЁТ(B20:B79))

Примечание : Функция ДОВЕРИТ.СТЬЮДЕНТ() появилась в MS EXCEL 2010.


Момент степени k:

Центральный момент степени k:

Среднее значение

Кол-во посетителей 0 1 2 3 4 5 6
Количество наблюдений 114 115 52 52 24 13 30
Таблица 1. Количество посетителей в час

Чтобы найти среднее значение всех результатов необходимо сложить всё вместе и разделить на количество результатов:

μ = (114 • 0 + 115 • 1 + 52 • 2 + 52 • 3 + 24 • 4 + 13 • 5 + 30 • 6) / 400 = 716/400 = 1.79

То же самое мы можем проделать используя формулу 2:

μ = M(X) = Σ(Xi•pi) = 0 • 0.29 + 1 • 0.29 + 2 • 0.13 + 3 • 0.13 + 4 • 0.06 + 5 • 0.03 + 6 • 0.08 = 1.79 Момент первой степени, формула (5)

Собственно, формула 2 представляет собой среднее арифметическое всех значений
Итог: в среднем, 1.79 посетителя в час

Количество посетителей 0 1 2 3 4 5 6
Вероятность (%) 28.5 28.8 13 13 6 3.3 7.5
Таблица 2. Закон распределения количества посетителей

Отклонение от среднего

Посмотрите на это распределение, можно предположить, что в среднем случайная величина равна 100±5, поскольку кажется, что таких значений несравнимо больше чем тех, что меньше 95 или больше 105:

График 2. График функции вероятности. Распределение ≈ 100±5

но сумма таких расстояний, а следовательно и любое производное от этого числа, будет равно нулю, поэтому в качестве меры выбрали квадрат разниц между величинами и средним значением:

σ возведена в квадрат, поскольку вместо расстояний мы взяли квадрат расстояний. σ 2 называется дисперсией. Корень из дисперсии называется средним квадратическим отклонением, или среднеквадратическим отклоненим, и его используют в качестве меры разброса:

Возвращаясь к примеру, посчитаем среднеквадратическое отклонение для графика 2:

Квантиль

График 3. Функция распределения. Медиана

График 4. Функция распределения. 4-квантиль или квартиль

График 5. Функция распределения. 0.34-квантиль

То есть, если мы говорим о дециле (10-квантиле), то это означает, что мы разбили график на 10 частей, что соответствует девяти линяям, и для каждого дециля нашли значение случайной величины.

Для дискретного распределения квантиль необходимо выбирать следующим образом: квантиль гарантирует вероятность, поэтому, если рассчитанный квантиль не совпадает с одним и значений, необходимо выбирать меньшее значение.

Построение интервалов

Двусторонний доверительный интервал

Первый квартиль

Значение квартиля Q1 находится в интервале 68,98 – 71,70, соответствующего частоте fQ1 = 150:4 = 37,5

Третий квартиль

Значение квартиля находится в интервале 68,98 – 71,70, соответствующего частоте fQ3 = (3*150):4 = 112,5

Квартили непрерывного распределения

Примечание : Подробнее о Функции распределения см. статью Функция распределения и плотность вероятности в MS EXCEL .


Если известна функция плотности вероятности p (х) , то 1-й квартиль можно найти из уравнения:


Например, решив аналитическим способом это уравнение для Логнормального распределения lnN(μ; σ 2 ), получим, что медиана (2-й квартиль ) вычисляется по формуле e μ или в MS EXCEL =EXP(μ). При μ=1, медиана равна 2,718.

Обратите внимание на точку Функции распределения , для которой F(х)=0,5 (см. картинку выше или файл примера , лист Квартиль-распределение) . Абсцисса этой точки равна 2,718. Это и есть значение 2-го квартиля ( медианы ), что естественно совпадает с ранее вычисленным значением по формуле e μ .


Примечание : Напомним, что интеграл от функции плотности вероятности по всей области задания случайной величины равен единице:

Поэтому, линии квартилей ( х=квартиль ) делят площадь под графиком функции плотности вероятности на 4 равные части.

Квартили в MS EXCEL

Чтобы вычислить в MS EXCEL квартили заданного распределения необходимо использовать соответствующую обратную функцию распределения .

При вычислении квартилей в MS EXCEL используются обратные функции распределения : НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР() , ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье Распределения случайной величины в MS EXCEL .

Например, в MS EXCEL 1-й квартиль для логнормального распределения LnN(1;1) можно вычислить по формуле =ЛОГНОРМ.ОБР(0,25;1;1) , а 3-й квартиль для стандартного нормального распределения по формуле =НОРМ.СТ.ОБР(0,75) .

Моменты случайной величины

Моменты случайно величины описывают различные аспекты характера и формы нашего распределения.

Как видно на графике, чем выше значение пики, тем выше коэффициент эксцесса, т.е. у верхней кривой коэффициент эксцесса выше, чем у нижней.

Статистический анализ роста доли дохода в Excel за период

Пример 2. В таблице приведены данные о доходах предпринимателя за год. Доказать, что примерно 75% значений меньше, чем третий квартиль доходов.

Вид исходной таблицы:


Определим 3-й по формуле:



Определим соотношение чисел, меньше полученного числа, к общему количеству значений по формуле:


Анализ статистики случайно сгенерированных чисел в Excel

Пример 3. Имеется диапазон случайных чисел, отсортированный в порядке возрастания. Определить соотношение суммы чисел, которые меньше 1-го квартиля, к сумме чисел, которые превышают значение 1-го квартиля.

Чтобы сгенерировать случайное число в Excel воспользуемся функцией:

После генерации отсортируем случайно сгенерированные числа по возрастанию. Вид исходной таблицы данных со случайными числами:


Формула для расчета имеет следующий вид (формула массива CTRL+SHIFT+ENTER):

Функции СУММ с вложенными функциями ЕСЛИ выполняют расчет суммы только тех чисел, которые меньше и больше соответственно значения, возвращаемого функцией для исследуемого диапазона. Из полученных значений вычисляется частное. Результат расчетов:


Общая сумма чисел исследуемого диапазона, которые меньше 1-го квартиля, составляет всего 8,57% от общей суммы чисел, которые больше 1-го квартиля.

Расчет квартилей в R и SAS

Функция quantile в R использует все девять алгоритмов расчета квантилей, в соответствии с нумерацией, предложенной Hyndman and Fan в работе 1996 г. (рис. 15; если вы не знакомы с R, рекомендую начать с Алексей Шипунов. Наглядная статистика. Используем R! ). Квантиль при i-м методе расчета:


где i – номер метода, 1 ≤ i ≤ 9, (j–m)/n ≤ p < (j–m+1)/n, хj – j-ый порядковый элемент упорядоченного ряда, n – размер выборки, γ является функцией двух параметров: j = floor(np + m) и g = np + m – j, где floor – функция возвращающая наибольшее целое, но всё еще меньшее, чем аргумент функции (аналог в Excel – ОКРВНИЗ.МАТ), m – константа, определяемая типом алгоритма расчета квантиля. Если вас интересуют подробности, обратитесь к справочной системе R.

SAS предлгает 5 методов расчета квантилей.


Расчет децилей для дискретного ряда


Определяем номер дециля по формуле: ,

Если номер дециля – целое число, то значение дециля будет равно величине элемента ряда, которое обладает накопленной частотой равной номеру дециля. Например, если номер дециля равен 20, его значение будет равно значению признака с S =20 (накопленной частотой равной 20).

Если номер дециля – нецелое число, то дециль попадает между двумя наблюдениями. Значением дециля будет сумма, состоящая из значения элемента, для которого накопленная частота равна целому значению номера дециля, и указанной части (нецелая часть номера дециля) разности между значением этого элемента и значением следующего элемента.

Например, если номер дециля равна 20,25, дециль попадает между 20-м и 21-м наблюдениями, и его значение будет равно значению 20-го наблюдения плюс 1/4 разности между значением 20-го и 21-го наблюдений.

Квантили специальных видов

Часто используются Квантили специальных видов:


В качестве примера вычислим медиану (0,5-квантиль) логнормального распределения LnN(0;1) (см. файл примера лист Медиана ).

Это можно сделать с помощью формулы =ЛОГНОРМ.ОБР(0,5; 0; 1)

Квантили стандартного нормального распределения

Необходимость в вычислении квантилей стандартного нормального распределения возникает при проверке статистических гипотез и при построении доверительных интервалов.

Примечание : Про проверку статистических гипотез см. статью Проверка статистических гипотез в MS EXCEL . Про построение доверительных интервалов см. статью Доверительные интервалы в MS EXCEL .

В данных задачах часто используется специальная терминология:

    Нижний квантиль уровняальфа ( α percentage point) файл примера лист Квантили ).



Для α=0,05, нижний 0,05-квантиль стандартного нормального распределения равен -1,645. Вычисления в MS EXCEL можно сделать по формуле:

Действительно, для α=0,05, верхний 0,05-квантиль стандартного нормального распределения равен 1,645. Т.к. функция плотности вероятности стандартного нормального распределения является четной функцией, то вычисления в MS EXCEL верхнего квантиля можно сделать по двум формулам:

Чтобы пояснить название « верхний» квантиль , построим график плотности вероятности и функцию вероятности стандартного нормального распределения для α=0,05.



Выделенная площадь на рисунке соответствует вероятности, что случайная величина примет значение больше верхнего 0,05-квантиля , т.е. больше значения 1,645. Эта вероятность равна 0,05.



Невыделенная площадь на рисунке соответствует вероятности, что случайная величина примет значение между нижним квантилем уровня α /2 и верхним квантилем уровня α /2, т.е. будет между значениями -1,960 и 1,960 при α=0,05. Эта вероятность равна в нашем случае 1-(0,05/2+0,05/2)=0,95. Если Z 0 попадает в одну из выделенных областей, то нулевая гипотеза отклоняется.

Другими словами, двусторонние α-квантили задают интервал, в который рассматриваемая случайная величина попадает с заданной вероятностью α.

Квантили распределения Стьюдента

Аналогичным образом квантили вычисляются и для распределения Стьюдента . Например, вычислять верхний α/2- квантиль распределения Стьюдента с n -1 степенью свободы требуется, если проводится проверка двухсторонней гипотезы о среднем значении распределения при неизвестной дисперсии ( см. эту статью ).

Для верхних квантилей распределения Стьюдента часто используется запись t α/2,n-1 . Если такая запись встретилась в статье про проверку гипотез или про построение доверительного интервала , то это именно верхний квантиль .

Примечание : Функция плотности вероятности распределения Стьюдента , как и стандартного нормального распределения , является четной функцией.

.2X означает 2 хвоста, т.е. двусторонний квантиль .

Квантили распределения ХИ-квадрат

Вычислять квантили распределения ХИ-квадрат с n -1 степенью свободы требуется, если проводится проверка гипотезы о дисперсии нормального распределения (см. статью Проверка статистических гипотез в MS EXCEL о дисперсии нормального распределения ).

При проверке таких гипотез также используются верхние квантили. Например, при двухсторонней гипотезе требуется вычислить 2 верхних квантиля распределения ХИ 2 : χ 2 α/2,n-1 и χ 2 1- α/2,n-1 . Почему требуется вычислить два квантиля , не один, как при проверке гипотез о среднем , где используется стандартное нормальное распределение или t-распределение ?

Дело в том, что в отличие от стандартного нормального распределения и распределения Стьюдента , плотность распределения ХИ 2 не является четной (симметричной относительно оси х). У него все квантили больше 0, поэтому верхний альфа-квантиль не равен нижнему (1-альфа)-квантилю или по-другому: верхний альфа-квантиль не равен нижнему альфа-квантилю со знаком минус.

Результат равен 20,48. .ПХ означает правый хвост распределения, т.е. тот который расположен вверху на графике функции распределения .

Чтобы вычислить верхний (1-0,05/2)- квантиль при том же числе степеней свободы , т.е. χ 2 1-0,05/2,n-1 и необходимо записать формулу =ХИ2.ОБР.ПХ(1-0,05/2; 10) или =ХИ2.ОБР(0,05/2; 10)

Читайте также: