Wilcoxon Rank Sum Test Calculator (Mann-Whitney U)

Сравните две независимые выборки с помощью непараметрического критерия Уилкоксона суммы рангов (Mann-Whitney U). Получите U, Z и p без предположения о нормальности.

Введите две независимые выборки как числа, разделённые запятыми, выберите уровень значимости и тип хвоста, затем нажмите «Вычислить».

Wilcoxon Rank Sum Test Calculator (Mann-Whitney U)
Сравните две независимые выборки с помощью непараметрического критерия Уилкоксона суммы рангов (Mann-Whitney U). Получите U, Z и p без предположения о нормальности.

О критерии Уилкоксона суммы рангов

Критерий Уилкоксона суммы рангов, также известный как U-критерий Манна — Уитни, — это непараметрический статистический критерий проверки гипотез, который используется для определения того, принадлежат ли две независимые выборки к генеральным совокупностям с одинаковым распределением. В отличие от t-критерия для независимых выборок, он не предполагает нормальность данных, что делает его мощной альтернативой для порядковых данных, асимметричных распределений или малых выборок, для которых нормальность нельзя установить. Изначально критерий был предложен Фрэнком Уилкоксоном в 1945 году, а затем расширен Манном и Уитни в 1947 году до формы, наиболее часто используемой сегодня. Статистика U Манна — Уитни подсчитывает, сколько раз значение из одной группы превосходит значение из другой группы. Большое значение U для одной выборки по сравнению с другой указывает на различие медиан или центральных тенденций двух популяций. Процедура вычисления начинается с объединения обеих выборок и ранжирования всех наблюдений от меньшего к большему. Связанным значениям присваивается средний ранг тех позиций, которые они заняли бы иначе. Затем отдельно вычисляется сумма рангов для каждой группы; по этим суммам выводятся статистики U. Для больших выборок распределение U хорошо аппроксимируется нормальным распределением, и для получения p-значения используется Z-оценка. Нулевая гипотеза утверждает, что две популяции идентичны — между их распределениями нет систематической разницы. Альтернативная гипотеза может быть двусторонней (любое различие), правосторонней (группа 1 обычно больше) или левосторонней (группа 1 обычно меньше). Тип хвоста нужно выбирать исходя из исследовательского вопроса до сбора данных, чтобы не увеличивать ошибку первого рода. p-значение интерпретируют относительно выбранного уровня значимости α (обычно 0.05). Если p < α, нулевая гипотеза отвергается и делается вывод о статистически значимом различии между группами. Если p ≥ α, доказательств недостаточно, чтобы сделать вывод о различии. Этот критерий широко применяется в медицине для сравнения исходов у пациентов в группах лечения и контроля, когда результат может не подчиняться нормальному распределению. В психологии он может сравнивать ответы по шкале Лайкерта между демографическими группами. В экологии он позволяет проверить, различаются ли измерения в двух точках наблюдения. В образовании он сравнивает результаты учащихся, обучавшихся разными методами. Для наилучших результатов убедитесь, что наблюдения внутри каждой выборки независимы друг от друга и что две выборки независимы между собой. Критерий наиболее мощен для выявления различий положения (сдвигов медианы), когда исходные распределения имеют схожую форму.

Практические примеры

Посмотрите на эти распространённые сценарии, чтобы увидеть, как применяется критерий Уилкоксона суммы рангов.

ВводВыводПримечание
S1: 7, 8, 8, 9, 10, 12 — S2: 9, 11, 12, 13, 14, 15 — α=0.05, two-tailedU=4, Z≈−2.24, p≈0.025Время восстановления после лекарства — значимое различие; группа препарата восстанавливается быстрее.
S1: 85, 90, 78, 92, 88, 76 — S2: 72, 80, 81, 75, 68, 79 — α=0.05, right-tailedU=6, Z≈1.92, p≈0.027Баллы за метод обучения — новый метод даёт значительно более высокие результаты.
S1: 120, 125, 130, 110, 115, 122, 128 — S2: 130, 135, 140, 128, 132, 138, 142 — α=0.01, left-tailedU=2, Z≈−2.88, p≈0.002Урожайность с удобрением — удобрение B даёт значительно больший урожай.

Как пользоваться калькулятором

  1. Введите числовые значения для выборки 1 в первое поле, разделяя их запятыми или пробелами.
  2. Введите значения независимой выборки 2 во второе поле.
  3. Выберите уровень значимости α (0.01, 0.05 или 0.10), нажав соответствующую кнопку.
  4. Выберите тип хвоста: двусторонний для любого различия, правосторонний, если ожидаете, что выборка 1 будет больше, или левосторонний, если ожидаете, что выборка 1 будет меньше.
  5. Нажмите «Вычислить», чтобы увидеть статистику U, Z-оценку, p-значение и статистическое решение.

Часто задаваемые вопросы

В чём разница между критерием Уилкоксона суммы рангов и критерием Манна — Уитни?
Это один и тот же критерий с разными названиями и формулировками. Уилкоксон определил статистику как сумму рангов, а Манн и Уитни определили U как число попарных сравнений, благоприятных для одной из групп. Эти две статистики линейно связаны и дают одинаковые p-значения.
Когда следует использовать критерий Уилкоксона суммы рангов вместо t-критерия?
Используйте критерий Уилкоксона, когда данные порядковые, когда нарушено предположение о нормальности (особенно в малых выборках) или когда есть выбросы. Для больших выборок из примерно нормальных распределений t-критерий и критерий Уилкоксона дают похожие результаты, но у t-критерия немного выше статистическая мощность.
Что означает двусторонний и односторонний тест?
Двусторонний тест проверяет наличие любого различия между группами, независимо от направления. Правосторонний тест проверяет, является ли выборка 1 стохастически больше выборки 2, а левосторонний — наоборот. Тип хвоста всегда нужно выбирать по гипотезе до сбора данных.
Как калькулятор обрабатывает связанные значения?
Связанные значения в объединённом наборе данных получают средний ранг тех позиций, которые они заняли бы. Например, если две наблюдения разделили ранги 3 и 4, обе получают 3.5. Такая поправка по среднему рангу сохраняет корректность сумм рангов и точность Z-аппроксимации.
Какой размер выборки нужен для надёжной Z-аппроксимации?
Обычно нормальная аппроксимация считается достаточной, когда и n₁, и n₂ не меньше 8–10. Для очень маленьких выборок (n < 8) следует использовать точное распределение U. Этот калькулятор использует нормальную аппроксимацию, поэтому при очень малых выборках p-значения следует интерпретировать осторожно.
Можно ли использовать этот тест для нечисловых или порядковых данных?
Да. Если вы можете присвоить наблюдениям осмысленные ранги — например, ответы по шкале Лайкерта (1=совершенно не согласен, 5=полностью согласен), — критерий Уилкоксона суммы рангов подходит. Нужно лишь уметь упорядочить наблюдения; точные числовые расстояния не требуются.