Критерий краскела уоллиса в excel как сделать

Обновлено: 06.07.2024

Аннотация научной статьи по фундаментальной медицине, автор научной работы — Унгуряну Т. Н., Гржибовский Андрей Мечиславович

В статье рассматриваются теоретические основы применения критерия Краскела Уоллиса для сравнения трех и более независимых групп количественных или порядковых данных. Приводится пример расчета критерия «вручную» с помощью формул, а также пошаговый алгоритм использования его в пакете статистических программ STATA. Особое внимание уделяется необходимым условиям, которые должны соблюдаться для применения критерия Краскела Уоллиса . Представлены рекомендации для оформления результатов в научных публикациях.

Похожие темы научных работ по фундаментальной медицине , автор научной работы — Унгуряну Т. Н., Гржибовский Андрей Мечиславович

Сравнение количественных данных трех и более независимых выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии Анализ трех и более независимых групп количественных данных Краткие рекомендации по описанию, статистическому анализу и представлению данных в научных публикациях Полиморфизм rs8193036 гена ИЛ-17А в казахской популяции и его связь с продукцией ИЛ-17А у больных рожей Возможности сывороточного цистатина с в диагностике пиелонефрита у беременных i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ANALYSIS OF THREE INDEPENDENT GROUPS USING NON-PARAMETRIC KRUSKAL-WALLIS TEST IN STATA SOFTWARE

In this paper, we have presented theoretical principles of analysis of three or more independent groups using the Kruskal-Wallis test . We have presented calculations using formulas as well as a step-by-step algorithm for use of this test in STATA software. Moreover, we have given practical examples with special emphasis on assumptions of this test. We have also presented recommendations for presentation of results in scientific publications.

Текст научной работы на тему «Сравнение трех и более независмых групп с использованием непараметрического критерия Краскела Уоллиса в программе Stata»

СРАВНЕНИЕ ТРЕХ И БОЛЕЕ НЕЗАВИСМЫХ ГРУПП С ИСПОЛЬЗОВАНИЕМ НЕПАРАМЕТРИЧЕСКОГО КРИТЕРИЯ КРАСКЕЛА - УОЛЛИСА В ПРОГРАММЕ STATA

© 2014 г. Т. Н. Унгуряну, *А. М. Гржибовский

Северный государственный медицинский университет, г. Архангельск *Норвежский институт общественного здравоохранения, г. Осло, Норвегия

Критерий Краскела — Уоллиса (Кгшка1^а1^ H-test) является непараметрическим аналогом однофакторного дисперсионного анализа для сравнения трех и более независимых групп [2, 6]. Данный критерий используется, если распределение в группах не подчиняется закону нормального распределения, что нередко встречается в медицинских исследованиях, особенно в выборках малого объема. В таких ситуациях следует либо трансформировать имеющиеся данные с помощью различных арифметических преобразований до достижения нормальности распределения [4], после чего можно будет применять дисперсионный анализ, либо применять критерий Краскела — Уоллиса, иногда еще называемый непараметрическим дисперсионным анализом. Критерий Краскела — Уоллиса рассчитывается с использованием не фактических значений переменных, а их рангов, поэтому является методом выбора при сильно скошенных распределениях. С его помощью проверяют нулевую гипотезу о том, что медианные значения признака в популяциях, из которых были извлечены исследуемые выборки, не различаются [1].

Расчет критерия Краскела — Уоллиса. Сначала все значения, независимо от того, какой выборке они принадлежат, упорядочивают по возрастанию, как если бы это была одна объединенная выборка. Каждому значению присваивается ранг от наименьшего к наибольшему — номер его места в упорядоченном ряду. Совпадающим значениям присваивают одинаковый ранг, равный среднему тех мест, которые эти величины делят между собой в общем упорядоченном ряду. После ранжирования следует проверить, чтобы общее количество рангов было равно количеству наблюдений в объединенной выборке. Затем вычисляют суммы рангов, относящихся к каждой группе (Я). Далее подсчитывают тестовую статистику критерия Краскела — Уоллиса (Н) по формуле:

где Я — сумма рангов для каждой группы; п. — количество наблюдений в каждой группе; N — общее количество наблюдений в объединенной выборке.

Если число сравниваемых групп 3, а количество наблюдений в каждой группе не менее 5 (для четырех групп — общее число наблюдений не менее 10), то расчетное значение тестовой статистики Н сравнивают с критическим значением хи-квадрат Пирсона (х2), так как распределение Н близко распределению х2 с числом степеней свободы df = к — 1, где к — число групп. Если расчетное значение Н равно или превышает критическое значение х2, то Н0 отвергается.

Если число наблюдений в группах менее 5, то в качестве критического значения используют табличные значения распределения Краскела —

В статье рассматриваются теоретические основы применения критерия Краскела - Уоллиса для сравнения трех и более независимых групп количественных или порядковых данных. Приводится пример расчета критерия «вручную» с помощью формул, а также пошаговый алгоритм использования его в пакете статистических программ STATA. Особое внимание уделяется необходимым условиям, которые должны соблюдаться для применения критерия Краскела - Уоллиса. Представлены рекомендации для оформления результатов в научных публикациях. Ключевые слова: непараметрические тесты, независимые группы, критерий Краскела - Уоллиса

Уоллиса. В этом случае, если расчетное значение Н равно или превышает критическое значение Н0 05, Н0 отвергается. При использовании таблицы критических значений критерий Краскела — Уоллиса установить различия между тремя группами можно, если минимальное число наблюдений в одной группе составляет 3, а в двух других группах — по 2 наблюдения. При сопоставлении четырех или пяти групп минимальное число наблюдений в каждой группе должно быть равно 2.

Пример. Для оценки дозовой нагрузки химическими веществами, загрязняющими питьевую воду, изучалось количество потребляемой для питья водопроводной воды среди разных возрастных групп населения. Поскольку исследуемые группы являются независимыми, а данные имеют ненормальное распределение, то для проверки нулевой гипотезы о равенстве медианных значений количества потребляемой для питья воды в популяциях детей, подростков и взрослого населения использовался критерий Краскела — Уоллиса (табл. 1).

Ранжирование значений водопотребления в трех возрастных группах для расчета тестовой статистики критерия Краскела - Уоллиса

Группа 1, дети (п=8) Группа 2, подростки (п=7) Группа 3, взрослые (п=9)

Вода, л/день Ранг Вода, л/день Ранг Вода, л/день Ранг

1,22 1 1,47 6 1,56 10

1,24 2 1,52 7,5 1,58 11

1,31 3,5 1,55 9 1,81 13

1,31 3,5 1,70 12 1,89 15

1,45 5 1,93 16 2,00 18

1,52 7,5 2,00 18 2,00 18

1,84 14 3,00 23 2,55 21

Сумма рангов 56,5 91,5 152

Расчетное значение тестовой статистики критерия Краскела — Уоллиса (Н) в данном примере оказалось равным 8,24. Для оценки нулевой гипотезы необходимо расчетное значение критерия (Н) сравнить с табличным значением критерия х2. Из таблицы критических значений критерия х2 для числа степеней свободы df= к — 1 = 3 — 1 = 2 и уровня статистической значимости 0,05 критическое значение х2 составляет 5,99. Так как расчетное значение больше критического, то имеют место статистически значимые (р < 0,05) различия в количестве потребляемой питьевой воды в разных возрастных группах населения.

Как и дисперсионный анализ, критерий Краскела — Уоллиса поможет выяснить, имеются ли различия между группами, но не сможет показать, между какими из групп эти различия существуют. При обнаружении статистически значимых различий между группами с помощью критерия Краскела — Уоллиса далее следует проводить апостериорные сравнения с помощью критерия Манна — Уитни или двух-выборочного критерия Вилкоксона [3, 7]. Следует помнить, что, поскольку STATA не дает возможности автоматически проводить апостериорные сравнения с помощью непараметрических методов статистики, исследователям самим необходимо рассчитывать новые критические уровни значимости исходя из представленных выше формул или как показано в табл. 2. Во всех приведенных примерах исследователи должны принимать во внимание проблему множественных сравнений и рассчитывать новые критические уровни значимости [5].

Для ситуации с тремя сравниваемыми группами количество возможных попарных сравнений равно количеству изучаемых групп (табл. 2). Если групп больше, то количество возможных попарных сравнений можно рассчитать по формуле: п = 0,5N ^ — 1), где N — количество изучаемых групп. Например, если имеется 12 групп (например, при попарных сравнениях среднемесячных значений тех или иных показателей), то максимальное количество возможных сравнений составит п = 0,5 х 12 х (12 — 1) = 66. Если оставить критический уровень значимости без изменений (0,05), то верятность случайного обнаружения статистически значимых различий составит 1 — 0,9566 = 0,966, или 96,6 %. Критический уровень значимости для данного примера при проведении всех 66 сравнений должен быть установлен на

уровне 1 — 0,951/66 = 0,00078, то есть статистически значимыми могут считаться только те различия, для которых р < 0,00078,

Количество возможных сравнений, вероятность ошибки первого типа и уровни значимости для наиболее часто встречающегося в литературе количества сравниваемых групп

Количество сравниваемых групп 2 3 4 5

Количество попарных сравнений 1 3 6 10

Вероятность случайного выявления статистически значимых различий (ошибка 1 типа) для множественных попарных сравнений, % 5 14 26 40

Критический уровень значимости 0,0500 0,0170 0,0085 0,0051

Количество сравнений с контрольной группой 1 2 3 4

Вероятность случайного выявления статистически значимых различий (ошибка 1 типа) для множественных сравнений с контрольной группой, % 5 10 14 19

Критический уровень значимости 0,0500 0,0253 0,0170 0,0127

Расчет критерия Краскела - Уоллиса в STATA.

Для использования критерия Краскела — Уоллиса в STATA [9] необходимо открыть диалоговое окно kwallis-Kruskal-Wallis equality-of-populations rank, которое открывается при помощи меню Statistics ® Summaries, tables, and tests ® Nonparametric tests of hypotheses ® Kruskal-Wallis rank test (рис. 1). В поле Outcome variable помещается изучаемая переменная (Water). В поле Variable defining groups помещается группировочная переменная (Group).

Рис. 1. Диалоговое окно для расчета критерия Краскела — Уоллиса

Результаты сравнения групп с помощью критерия Краскела — Уоллиса представлены на рис. 2, где в таблице указаны номер группы, число наблюдений в каждой группе (Obs) и сумма рангов для каждой

группы (Rank Sum). Под таблицей даны значения критерия, обозначенные как chi-squared, количество степеней свободы (df) и достигнутый уровень значимости различий (probability). Результаты показывают, что есть статистически значимые различия в количестве потребляемой для питья воды в трех возрастных группах населения. Для того чтобы узнать, какие группы различаются между собой, следует провести попарные сравнения групп при помощи критерия Манна — Уитни с новым критическим уровнем значимости: 0,05 / 3 = 0,017.

Рис. 2. Результаты сравнения водопотребления в группах детей, подростков и взрослых с помощью критерия Краскела — Уоллиса

Результаты попарных сравнений, выполненных с помощью критерия Манна — Уитни (или двухвыбо-рочного критерия Вилкоксона, Two-sample Wilcoxon rank-sum test), показали, что достигнутый уровень статистической значимости (р) составил между 1-й и 2-й группами 0,055; 2-й и 3-й группами — 0,184; 1-й и 3-й группами — 0,009. Таким образом, среднее количество потребляемой для питья воды статистически значимо различается только между 1-й группой (детьми) и 3-й группой (взрослыми).

При представлении результатов сравнения групп с помощью критерия Краскела — Уоллиса следует указывать значение тестовой статистики (Н) и достигнутый уровень статистической значимости (р), например, Н = 8,24; р = 0,016. В случае апостериорных сравнений с помощью критерия Манна — Уитни необходимо указать z-значение и величину достигнутого уровня статистической значимости (р).

Можно ли применять непараметрический критерий Краскела — Уоллиса, если данные подчиняются закону нормального распределения? Критерий имеет несколько меньшую статистическую мощность, чем дисперсионный анализ, поэтому при нормальном распределении и выполнении прочих условий дисперсионный анализ является методом выбора. Некоторые исследователи не рекомендуют применять параметрические методы (в том числе и дисперсионный анализ), если объем каждой из групп составляет менее 30 наблюдений, даже если выборочные данные имеют нормальное распределение [8]. Можно ли использовать дисперсионный анализ при отклонении распределения от нормального? При наличии больших выборок с равными дисперсиями дисперсионный анализ достаточно устойчив к небольшим отклонениям распределения от нормального, особенно

при равных объемах выборок. При малых выборках применение дисперсионного анализа для скошенных распределений может привести к сильно искаженным результатам, поэтому рекомендуется в такой ситуации применять критерий Краскела — Уоллиса.

1. Банержи А. Медицинская статистика понятным языком: вводный курс. М. : Практическая медицина, 2007. 287 с.

2. Гланц С. Медико-биологическая статистика. М. : Практика, 1998. 460 с.

3. Гржибовский А. М. Анализ количественных данных для двух независимых групп // Экология человека. 2008. № 2. С. 54-61.

4. Гржибовский А. М. Типы данных, проверка распределения и описательная статистика // Экология человека. 2008. № 1. С. 52-58.

5. Гржибовский А. М. Анализ трех и более независимых групп количественных данных // Экология человека. 2008. № 3. С. 50-58.

6. Медик В. А., Токмачев М. С. Математическая статистика в медицине : учеб. пособие. М. : Финансы и статистика, 2007. 800 с.

7. Петри А., Сэбин К. Наглядная медицинская статистика / пер. с англ. под ред. В. П. Леонова. М. : ГЭОТАР-Медиа, 2009. 168 с.

8. Chang Y. H. Biostatistics 101: Data presentation // Singapore Medical Journal. 2003. N 6. P. 280-285.

9. Hamilton L. C. Statistics with STATA: Updated for Version 10. Brooks/Cole, Cengage Learning, 2009. 491 р.

1. Banerjee A. Meditsinskaya statistika ponyatnym yazykom: vvodnyi kurs [Medical Statistics Made Clear: Introduction]. Moscow, 2007, 287 p.

2. Glantz S. Basic biostatistics (translated from English into Russian). Moscow, Praktika Publ., 1998. 459 p.

3. Grjibovski A. M. Analysis of quantitative data for two independent groups. Ekologiya cheloveka [Human Ecology]. 2008, 2, pp. 54-61. [in Russian]

4. Grjibovski А. М. Data types, control of distribution and descriptive statistics. Ekologiya cheloveka [Human Ecology]. 2008, 1, pp. 52-58. [in Russian]

5. Grjibovski A. M. Analysis of three and more independent groups of quantitative data. Ekologiya cheloveka [Human Ecology]. 2008, 3, pp.50-58. [in Russian]

6. Medik V. A., Tokmachev M. S. Matematicheskaya statistika v meditsine [Mathematical Statistics in Medicine]. Moscow, Finansy i statistika Publ., 2007, 800 p.

7. Petrie A., Sabin K. Naglyadnaya statistika v meditsine [Medical Statistics at Glance]. Moscow, GEOTAR-Media Publ., 2003, 144 p.

8. Chang Y. H. Biostatistics 101: Data presentation. Singapore Medical Journal. 2003, 6, pp. 280-285.

9. Hamilton L. C. Statistics with STATA: Updated for Version 10. Brooks/Cole, Cengage Learning, 2009, 491 р.

ANALYSIS OF THREE INDEPENDENT GROUPS USING NON-PARAMETRIC KRUSKAL-WALLIS TEST IN STATA SOFTWARE

T. N. Unguryanu, *A. M. Grjibovski

International School of Public Health, Northern State Medical University Arkhangelsk, Russia *Department of International Public Health, Norwegian Institute of Public Health, Oslo, Norway

In this paper, we have presented theoretical principles of analysis of three or more independent groups using the Kruskal-Wallis test. We have presented calculations using formulas as well as a step-by-step algorithm for use of this test in STATA software. Moreover, we have given practical examples with special emphasis on assumptions of this test. We have also presented recommendations for presentation of results in scientific publications.

A Kruskal-Wallis Test is used to determine whether or not there is a statistically significant difference between the medians of three or more independent groups. It is considered to be the non-parametric equivalent of the One-Way ANOVA.

This tutorial explains how to conduct a Kruskal-Wallis Test in Excel.

Example: Kruskal-Wallis Test in Excel

Researchers want to know if three different fertilizers lead to different levels of plant growth. They randomly select 30 different plants and split them into three groups of 10, applying a different fertilizer to each group. At the end of one month they measure the height of each plant.

Use the following steps to perform a Kruskal-Wallis Test to determine if the median growth is the same across the three groups.

Step 1: Enter the data.

Enter the following data, which shows the total growth (in inches) for each of the 10 plants in each group:

Raw data in three columns in Excel

Step 2: Rank the data.

Next, we will use the RANK.AVG() function to assign a rank to the growth of each plant out of all 30 plants. The following formula shows how to calculate the rank for the first plant in the first group:


Copy this formula to the rest of the cells:


Then, calculate the sum of the ranks for each column along with the sample size and the squared sum of ranks divided by the sample size:


Step 3: Calculate the test statistic and the corresponding p-value.

The test statistic is defined as:

  • n = total sample size
  • Rj 2 =sum of ranks for the j th group
  • nj =sample size of j th group

Under the null hypothesis, H follows a Chi-square distribution with k-1 degrees of freedom.

The following screenshot shows the formulas used to calculate the test statistic, H, and the corresponding p-value:

Kruskal Wallis test calculation in Excel

The test statistic is H = 6.204 and the corresponding p-value is p = 0.045. Since this p-value is less than 0.05, we can reject the null hypothesis that the median plant growth is the same for all three fertilizers. We have sufficient evidence to conclude that the type of fertilizer used leads to statistically significant differences in plant growth.

Step 4: Report the results.

Lastly, we want to report the results of the Kruskal-Wallis Test. Here is an example of how to do so:

A Kruskal-Wallist Test was performed to determine if median plant growth was the same for three different plant fertilizers. A total of 30 plants were used in the analysis. Each fertilizer was applied to 10 different plants.

The test revealed that the median plant growth was not the same (H = 6.204, p = 0.045) among the three fertilizers. That is, there was a statistically significant difference in median plant growth among two or more of the fertilizers.

Критерий Краскела-Уоллиса - это непараметрическая альтернатива одномерному (межгрупповому) дисперсионному анализу. Он используется для сравнения трех или более выборок, и проверяет нулевые гипотезы, согласно которым различные выборки были взяты из одного и того же распределения, или из распределений с одинаковыми медианами.

Таким образом, интерпретация критерия Краскела-Уоллиса в основном сходна с параметрическим одномерным дисперсионным анализом, за исключением того, что этот критерий основан скорее на рангах, чем на средних. Для дополнительных деталей, см. Siegel & Castellan, 1988.

Этот непараметрический критерий — расширение двухвыборочного критерия Вилкоксона ранговых сумм. При нулевой гипотезе отсутствия различий в распределениях между группами суммы рангов в каждой из k групп должны быть сравнимы после учета любых различий в размере выборки.

Определить нулевую и альтернативную гипотезы.


: каждая группа имеет одинаковое распределение величин в популяции.


: каждая группа не имеет одинакового распределения величин в популяции.

Отобрать необходимые данные из двух взаимосвязанных выборок.


Вычислить величину статистики критерия, отвечающую ,


Проранжируйте все n значений и рассчитайте сумму рангов в каждой из групп: эти суммы — . Статистика критерия (которая должна быть модифицирована, если имеется много связанных значений) выражается формулой:


Сравнить значение статистики F-критерия со значением из известного распределения вероятности.

Интерпретировать величину р и результаты.

Интерпретируйте величину р, и если результат статистически значим, используйте двухвыборочные непараметрические критерии, корректируя их для множественного тестирования. Рассчитайте ДИ для медианы в каждой группе. Однофакторный ANOVA применяют тогда, когда группы соотносятся с одним фактором и независимы. Можно использовать другие виды ANOVA, если план исследования более сложен.

Пример

Так, допустим, в ходе исследований изучали влияние препарата X на пациентов, разделенных по какому-то признаку Y на 3 группы равного объема (A, B, C). Результаты такого выдуманного исследования приведены в таблице:


Рис. 1. Пример исходных данных.

Выбираем команду Непараметрическая статистика из меню Анализ для отображения стартовой панели модуля Непараметрическая статистика. Далее выбираем Сравнение нескольких независимых групп и нажимаем кнопку OK для отображения диалогового окна ДА Краскела-Уоллиса. Нажимаем кнопку Переменные для отображения диалогового окна Выбор переменных. Выбираем переменную Влияние как зависимую и переменную Группа как группирующую. Нажимаем кнопку Коды, отобразится диалоговое окно Выбираем коды для группирующей переменной; в этом диалоге выберите все коды (нажав кнопку Все и затем кнопку OK). Диалоговое окно ДА Краскела-Уоллиса появится на экране:


Рис. 2. Диалоговое окно.

В диалоговом окне нажимаем ОК и начинаем анализ.


Рис. 3. Анализ.

Мы видим, что критерий Краскела-Уоллиса высоко значим (p = .001).Таким образом, характеристики различных экспериментальных групп значимо отличаются друг от друга. Напомним, что процедура Краскела-Уоллиса, по существу, является дисперсионным анализом, основанным на рангах. Суммы рангов (для каждой группы) показаны в правом столбце таблицы результатов. Наибольшая ранговая сумма (самое эффективное влияние препарата) относится к группе C. Наименьшая ранговая сумма (самое худшее влияние препарата) относится к группе A.

Пример: Дисперсионный анализ Краскела-Уоллиса и медианный тест

Эти тесты - альтернативны однофакторной межгрупповой ANOVA. Пример основан на (искусственных) данных, представленных в Hays (1981, стр. 592).

Рис. 4. Пример исходных данных.

Эти данные получены в исследовании маленьких детей, которые случайным образом приписывались к одной из трех экспериментальных групп. Каждому ребенку предлагалась серия парных тестов. Задача ребенка состояла в том, чтобы сделать правильный выбор и получить вознаграждение. В первой группе тестом была форма (группа 1 - Форма - 1 - Form), во второй - цвет (группа 2 - Цвет - 2 Color), в третьей - размер 3 - Размер - 3 - Size) предмета. Зависимая переменная - число испытаний, которые требовались каждому ребенку, чтобы получить вознаграждение.

Результаты критерия Краскела-Уоллиса.

Результаты ранговой ДА Краскела-Уоллиса будут показаны в первой таблице результатов, результаты медианного теста - во второй.

Рис. 5. Результаты критерия Краскела-Уоллиса.

Вы видите, что критерий Краскела-Уоллиса высоко значим.Таким образом, характеристики различных экспериментальных групп значимо отличаются друг от друга. Напомним, что процедура Краскела-Уоллиса, по существу, является дисперсионным анализом, основанным на рангах. Суммы рангов (для каждой группы) показаны в правом столбце таблицы результатов. Наибольшая ранговая сумма (самое худшее выполнение теста) относится к Размеру - Size (это тот параметр, который надо различить, чтобы получить вознаграждение). Наименьшая ранговая сумма (лучшее выполнение) относится к Форме - Form.

Результаты медианного теста.

Медианный критерий также значим, однако, в меньшей степени.

Рис. 6. Результаты медианного теста.

Напомним, что медианный критерий более "грубый" и менее чувствительный, чем критерий Краскела-Уоллиса. В таблице результатов показано число наблюдений (детей) в каждой экспериментальной группе, которые лежат ниже (или равны) общей медианы и число наблюдений, лежащих выше общей медианы . Снова, наибольшее число испытуемых с числом попыток (до получения вознаграждения) выше общей медианы относятся к группе Размер - Size. Больше всего испытуемых с числом попыток ниже медианы относятся к группе Форма - Form. Таким образом, медианный тест подтверждает, что форма предмета наиболее легко различается детьми, тогда как размер различается хуже всего.

Графическое представление результатов.

Рис. 7. График результатов медианного теста в виде диаграммы.

Снова ясно видно, выполнение теста Форма - Form было лучше любого другого; медиана числа испытаний при этом условии ниже, чем при любом другом.

Рис. 8. Категоризованная гистограмма.

Этот график снова подтверждает, что в группе Форма - Form выполнение "лучше" (распределение слегка скошено влево), чем при других условиях. Самое худшее выполнение, как отчетливо видно из графиков, для группы Размер - Size. Отсюда также можно заключить, что наиболее легко дети различают Форму - Form.

Порой, чтобы провести качественное исследование, получить достоверные результаты, необходимо пользоваться не только общими, всем известными приемами, но и осваивать новые инструменты. Для сравнения трех и более элементов, различных по характеру или содержанию, можно воспользоваться непараметрическим критерием Краскела-Уоллеса (критерий Н), который успешно применяют в статистических и психологических научных работах.

Порой, чтобы провести качественное исследование, получить достоверные результаты, необходимо пользоваться не только общими, всем известными приемами, но и осваивать новые инструменты. Для сравнения трех и более элементов, различных по характеру или содержанию, можно воспользоваться непараметрическим критерием Краскела-Уоллеса (критерий Н), который успешно применяют в статистических и психологических научных работах.

Когда целесообразно применение методики?

Любые параметрические и непараметрические критерии, используемые в психологических исследованиях, имеют ряд ограничений и условий. Методика Краскела-Уоллеса не является исключением из данного правила.

По сути, этот инструмент является достойным и надежным аналогом однофакторной модели дисперсионного анализа. Его использование целесообразно, если исследователь намерен изучать несколько выборок, групп или элементов (3,4 и более). Эксперты рекомендуют прибегать к нему в том случае, если результаты проведенного эксперимента возможно представить в виде последовательной шкалы.

Критерий Н

Применение критерия Н

Критерий Н позволяет оценить различия между объектами исследования, его элементами по конкретному признаку. Важно отметить, что применение этого непараметрического исследовательского инструмента возможно к несвязным выборкам и группам.

В основе методики Краскела-Уоллеса лежит ранжирование.

Условия применения критерия Краскела-Уоллеса

Смысл критерий Н заключается в следующем: исследователь может перейти от собранных эмпирических данных к их значениям после ранжирования.

Методика применима в следующих случаях:

  • Автор сумел выбрать не менее трех выборок испытуемых объектов;
  • Исследователь должен провести не менее 4 наблюдений за объектами исследования первой выборки, и не менее двух наблюдений за остальными испытуемыми группами для получения достоверных эмпирических данных. Важно соблюдение соотношения 4/2/2. Количество испытуемых в каждой выборке не играет роли.
  • Для оценки полученных результатов необходимо пользоваться специально разработанной таблицей критических значений.
  • Если какие-либо различия становятся «стертыми», то можно выявить их посредством попарного сравнения испытуемых между собой.

Нужна помощь преподавателя?

Мы всегда рады Вам помочь!

Этапы применения методики Краскела-Уоллеса

Чтобы провести исследование, важно знать правильную последовательность действий, которая приведет к успеху и достоверному результату. Сейчас мы расскажем порядок «эксплуатации» критерия Н.

Этапы пользования критерием Н

Как используют критерий Н?

Этап №1. Замена эмпирических данных на ранги.

Для начала необходимо обработать все полученные сведения и преобразовать их в числовой (математический) вид. Лучше всего при этом ввести систему обозначений каждого элемента и признака. Допустим, все данные эксперимента были обозначены xij, а их ранги rij. Далее необходимо проранжировать все полученные значения и сформировать «ранговую таблицу», в которой все элементы будут располагаться по возрастанию или убыванию ранга.

Этап №2. Выдвижение основной и альтернативной гипотез.

Здесь исследователь должен принять определенную позицию и выдвинуть идею, а затем сразу же предложить достойную альтернативу (на случай, если основная гипотеза не найдет своего подтверждения и буде опровергнута). Важным условием при формулировании гипотез является то, что основная гипотеза и ранжирование по ней должно отличаться от ранжирования альтернативной идеи (допускаются минимальные совпадения).

Этап №3. Определяем средние значения рангов по столбцу.

Определение среднего значения рангов по столбцу

Формула для определения среднего значения рангов по столбцу

С их помощью исследователь «оптимизирует и стабилизирует» разбросанные значения. В целях анализа более точных данных, также необходимо учесть случайную величину (которая минимизирует погрешности отклонения):

Случайная величина

Формула для расчета случайной величины

Этап №4. Критическая область и результат исследования.

Далее исследователю останется лишь сравнить полученные данные с табличными (таблица критических областей). Для наглядности можно построить графическую зависимость и проследить, каким образом пересекаются выборки, есть ли сходства и различия.

Если количество испытуемых небольшое, то можно воспользоваться готовыми таблицами, но при проведении исследования над тремя и более выборками – расчеты и анализ неизбежны.

Пример применения критерия Краскела-Уоллиса

Автор исследования проводил эксперимент над молодыми людьми в возрасте 20-22 лет, которые обучались в техническом ВУЗе. Эксперимент посвящался оценке интеллектуальной настойчивости. Он предполагал оценку навыков студентов по работе с анаграммами. Всего было определено 4 анаграммы разного уровня сложности. Работа с каждым испытуемым проходила в индивидуальном порядке. Время на проведение эксперимента не ограничивалось.

Исследователь заметил, что над некоторыми неразрешимыми анаграммами студенты работали дольше, чем над остальными. Поэтому было принято решение оценить, какая анаграмма для каждого из них была неразрешимой.

Автор намерен проверить: длительность попыток решить каждую анаграмму примерно одинакова. В связи с этим он выдвинул следующие гипотезы:


На текущий момент он располагает следующими данными:

Показатели длительности попыток

Применение методики

Рассмотрим порядок дальнейших действия и расчетов.

Как провести дальнейший расчет? Как подсчитать ранговые суммы?

Далее необходимо сделать следующее:

Методика Краскела-Уоллиса Как применяется методика на конкретном примере

Читайте также: