Калькулятор критерия суммы рангов Вилкоксона (Mann-Whitney U)
Сравните две независимые выборки с помощью непараметрического критерия суммы рангов Вилкоксона (Mann-Whitney U). Получите U-статистику, Z-оценку и p-значение без предположения о нормальности.
Введите две независимые выборки как числа, разделённые запятыми, выберите уровень значимости и тип хвоста, затем нажмите «Вычислить».
Калькулятор критерия суммы рангов Вилкоксона (Mann-Whitney U)
Сравните две независимые выборки с помощью непараметрического критерия суммы рангов Вилкоксона (Mann-Whitney U). Получите U-статистику, Z-оценку и p-значение без предположения о нормальности.
О критерии суммы рангов Вилкоксона
Критерий суммы рангов Вилкоксона, также известный как критерий Mann-Whitney U, — это непараметрический статистический критерий проверки гипотез, используемый для определения того, происходят ли две независимые выборки из совокупностей с одинаковым распределением. В отличие от t-критерия для независимых выборок, он не предполагает нормальное распределение данных, что делает его мощной альтернативой для порядковых данных, асимметричных распределений или малых выборок, где нормальность нельзя установить.
Первоначально критерий был предложен Фрэнком Вилкоксоном в 1945 году, а затем в 1947 году Манном и Уитни был расширен до формы, наиболее часто используемой сегодня. Статистика U Манна-Уитни подсчитывает, сколько раз значение из одной группы превосходит значение из другой группы. Большое U для одной выборки по сравнению с другой служит свидетельством того, что медианы или центральные тенденции двух совокупностей различаются.
Процедура вычисления начинается с объединения обеих выборок и ранжирования всех наблюдений от меньшего к большему. Связанным значениям присваивается средний ранг тех мест, которые они иначе заняли бы. Затем отдельно вычисляется сумма рангов для каждой группы; по этим суммам выводятся статистики U. Для больших выборок распределение U хорошо аппроксимируется нормальным распределением, и для получения p-значения используется Z-оценка.
Нулевая гипотеза утверждает, что две совокупности идентичны — в их распределениях нет систематических различий. Альтернативная гипотеза может быть двусторонней (любое различие), правосторонней (группа 1, как правило, больше) или левосторонней (группа 1, как правило, меньше). Тип хвоста следует выбирать до сбора данных в соответствии с исследовательским вопросом, чтобы не увеличивать вероятность ошибки первого рода.
p-значение интерпретируется относительно выбранного уровня значимости α (обычно 0,05). Если p < α, нулевая гипотеза отклоняется, и делается вывод о статистически значимом различии между группами. Если p ≥ α, доказательств недостаточно, чтобы утверждать о различии.
Критерий широко используется в медицине для сравнения результатов лечения и контроля, когда исход может не быть нормально распределён. В психологии он позволяет сравнивать ответы по шкале Лайкерта между демографическими группами. В экологии он помогает проверить, различаются ли измерения в двух местах. В образовании он сравнивает результаты тестов учащихся, обучавшихся разными методами.
Для наилучших результатов убедитесь, что наблюдения внутри каждой выборки независимы друг от друга, а две выборки независимы между собой. Критерий наиболее мощен для выявления различий положения (сдвига медианы), когда исходные распределения имеют схожую форму.
Практические примеры
Рассмотрите эти распространённые сценарии, чтобы увидеть, как применяется критерий суммы рангов Вилкоксона.
| Ввод | Результат | Примечание |
|---|---|---|
| S1: 7, 8, 8, 9, 10, 12 — S2: 9, 11, 12, 13, 14, 15 — α=0.05, two-tailed | U=4, Z≈−2.24, p≈0.025 | Время восстановления после препарата — значимое различие; группа препарата восстанавливается быстрее. |
| S1: 85, 90, 78, 92, 88, 76 — S2: 72, 80, 81, 75, 68, 79 — α=0.05, right-tailed | U=6, Z≈1.92, p≈0.027 | Оценки по методике обучения — новый метод даёт значительно более высокие результаты. |
| S1: 120, 125, 130, 110, 115, 122, 128 — S2: 130, 135, 140, 128, 132, 138, 142 — α=0.01, left-tailed | U=2, Z≈−2.88, p≈0.002 | Урожайность при удобрении — удобрение B даёт значительно более высокий урожай. |
Как пользоваться калькулятором
- Введите числовые значения для выборки 1 в первое поле, разделяя их запятыми или пробелами.
- Введите значения независимой выборки 2 во второе поле.
- Выберите уровень значимости α (0.01, 0.05 или 0.10), нажав соответствующую кнопку.
- Выберите тип хвоста: двусторонний для любого различия, правосторонний, если ожидаете, что выборка 1 больше, или левосторонний, если ожидаете, что выборка 1 меньше.
- Нажмите «Вычислить», чтобы увидеть U-статистику, Z-оценку, p-значение и статистическое решение.
Часто задаваемые вопросы
В чем разница между критерием суммы рангов Вилкоксона и критерием Mann-Whitney U?
Это один и тот же критерий с разными названиями и формулировками. Вилкоксон определил статистику как сумму рангов, а Манн и Уитни определили U как число попарных сравнений, благоприятных для одной из групп. Эти статистики линейно связаны и дают одинаковые p-значения.
Когда следует использовать критерий суммы рангов Вилкоксона вместо t-критерия?
Используйте критерий Вилкоксона, когда данные порядковые, когда нарушено предположение о нормальности (особенно в малых выборках) или когда присутствуют выбросы. Для больших выборок из примерно нормальных распределений t-критерий и критерий Вилкоксона дают похожие результаты, но t-критерий обладает немного большей статистической мощностью.
Что означает двусторонний и односторонний тест?
Двусторонний тест проверяет любое различие между группами независимо от направления. Правосторонний тест проверяет, является ли выборка 1 стохастически больше выборки 2, а левосторонний — наоборот. Тип хвоста следует всегда определять по гипотезе до сбора данных.
Как калькулятор обрабатывает связанные значения?
Связанные значения в объединённом наборе данных получают средний ранг тех мест, которые они заняли бы. Например, если две наблюдаемые величины делят 3-е и 4-е места, обе получают ранг 3,5. Такая коррекция средним рангом сохраняет корректность сумм рангов и точность Z-аппроксимации.
Какой размер выборки нужен для надёжной Z-аппроксимации?
Обычно нормальная аппроксимация считается достаточной, когда и n₁, и n₂ не меньше 8–10. Для очень малых выборок (n < 8) следует использовать точное распределение U. Этот калькулятор использует нормальную аппроксимацию, поэтому при очень малых выборках интерпретируйте p-значения осторожно.
Можно ли использовать этот тест для нечисловых или порядковых данных?
Да. Если вы можете присвоить наблюдениям осмысленные ранги — например, ответы по шкале Лайкерта (1 = совсем не согласен, 5 = полностью согласен) — критерий суммы рангов Вилкоксона подходит. Вам нужно только уметь упорядочить наблюдения; точные числовые расстояния не требуются.