Калькулятор хи‑квадрата с поправкой Йейтса
Рассчитайте статистику хи-квадрата с поправкой Йейтса для таблиц сопряженности 2×2. Уменьшите ошибку первого рода при малых ожидаемых частотах.
Введите четыре значения ячеек (a, b, c, d) из таблицы сопряженности 2×2, чтобы вычислить значение χ² с поправкой Йейтса и p-значение.
Калькулятор хи‑квадрата с поправкой Йейтса
Рассчитайте статистику хи-квадрата с поправкой Йейтса для таблиц сопряженности 2×2. Уменьшите ошибку первого рода при малых ожидаемых частотах.
Введите значения для таблицы сопряженности 2×2: группа A в строках, исход 1/2 в столбцах.
О поправке Йейтса на непрерывность
Поправка Йейтса на непрерывность — это корректировка критерия хи-квадрат (χ²) при использовании таблицы сопряженности 2×2. Распределение хи-квадрат является непрерывным, а наблюдаемые частоты в таблице сопряженности — это дискретные счетчики. Из-за этого приближение хи-квадрат может завышать статистику критерия, что приводит к слишком маленьким p-значениям и повышает риск ошибки первого рода — особенно при малом объеме выборки или малых ожидаемых частотах.
Фрэнк Йейтс предложил эту поправку в 1934 году. Идея проста: из модуля разницы между наблюдаемой и ожидаемой частотой вычитается 0,5 перед возведением в квадрат. Исправленная формула имеет вид χ² = Σ (|O − E| − 0.5)² / E, суммирование идет по всем четырем ячейкам. Эта небольшая корректировка уменьшает общее значение хи-квадрат, давая более консервативное (большее) p-значение, которое лучше отражает истинную вероятность наблюдаемого или более экстремального результата.
Поправка особенно важна, когда любая ожидаемая частота ниже 10, а тем более ниже 5. В таких условиях стандартный критерий хи-квадрат считается ненадежным, и поправка Йейтса помогает это компенсировать. При больших выборках, когда все ожидаемые частоты превышают 10, влияние поправки минимально, и стандартного критерия хи-квадрат достаточно.
Чтобы воспользоваться калькулятором, нужно представить данные в виде таблицы сопряженности 2×2. Две строки соответствуют двум группам (например, лечение и контроль), а два столбца — двум возможным исходам (например, успех и неудача). Ячейка a — это число объектов группы A с исходом 1, ячейка b — группы A с исходом 2, ячейка c — группы B с исходом 1, а ячейка d — группы B с исходом 2.
Степени свободы для таблицы 2×2 всегда равны 1. p-значение вычисляется по распределению хи-квадрат с 1 степенью свободы. По общепринятой интерпретации p-значение ниже 0.05 свидетельствует о статистически значимой связи между принадлежностью к группе и исходом.
В статистическом сообществе до сих пор спорят о том, когда использовать поправку Йейтса. Некоторые статистики считают, что она слишком сильно корректирует результат и снижает статистическую мощность. Альтернатива, которую многие современные статистики предпочитают при очень малых ожидаемых частотах, — точный критерий Фишера, вычисляющий точную вероятность без опоры на приближение хи-квадрат. Тем не менее, поправка Йейтса по-прежнему широко преподается и принимается во многих областях и является подходящим выбором, если нужен быстрый и консервативный результат для таблицы 2×2.
Практические примеры
Изучите разные сценарии, чтобы понять, как работает калькулятор.
| Ввод (a, b, c, d) | χ² / p-значение | Примечание |
|---|---|---|
| a=3, b=22, c=11, d=14 | χ²≈4.86, p≈0.027 | Испытание вакцины — значимо; вакцина снижает уровень заражения. |
| a=15, b=5, c=8, d=12 | χ²≈3.68, p≈0.055 | Метод обучения — пограничный, незначимо при α=0.05. |
| a=25, b=975, c=15, d=985 | χ²≈2.07, p≈0.151 | A/B-тест рекламы — значимых различий в CTR нет. |
| a=1, b=49, c=6, d=44 | χ²≈2.48, p≈0.115 | Исследование редкого побочного эффекта — из-за низких чисел в ячейках здесь поправка Йейтса необходима. |
Как пользоваться калькулятором
- Расположите данные в таблице 2×2: группа A в первой строке, группа B во второй строке, исход 1 в первом столбце, исход 2 во втором столбце.
- Введите количество для ячейки a (группа A, исход 1) в первое поле, а для ячейки b (группа A, исход 2) — во второе.
- Введите количество для ячейки c (группа B, исход 1) и ячейки d (группа B, исход 2) в оставшиеся поля. Все значения должны быть неотрицательными целыми числами.
- Нажмите Рассчитать, чтобы увидеть значение χ² с поправкой Йейтса, степени свободы (всегда 1), p-значение и решение о значимости.
- Используйте кнопки примеров, чтобы загрузить готовые данные и проверить результаты или изучить распространенные сценарии.
Часто задаваемые вопросы
Что такое поправка Йейтса на непрерывность?
Поправка Йейтса — это корректировка стандартной формулы хи-квадрат для таблиц 2×2. Она вычитает 0,5 из модуля разницы между наблюдаемыми и ожидаемыми частотами перед возведением в квадрат. Это делает критерий более консервативным и снижает риск ложноположительного результата (ошибка первого рода) при малых выборках или малых ожидаемых значениях.
Когда следует использовать поправку Йейтса вместо стандартного критерия хи-квадрат?
Используйте поправку Йейтса, если любая ожидаемая частота меньше 10. Стандартный критерий хи-квадрат подходит, когда все ожидаемые частоты равны 10 или больше. Для очень малых выборок, где любая ожидаемая частота ниже 5, рассмотрите точный критерий Фишера, так как в таком случае он еще надежнее.
Что означают ячейки a, b, c и d?
Ячейка a — это число субъектов группы A с исходом 1. Ячейка b — число субъектов группы A с исходом 2. Ячейка c — число субъектов группы B с исходом 1. Ячейка d — число субъектов группы B с исходом 2. В исследовании вакцины группа A может быть привитой, группа B — непривитой, исход 1 — заражение, исход 2 — отсутствие заражения.
Почему степени свободы для таблицы 2×2 всегда равны 1?
Степени свободы для критерия хи-квадрат независимости равны (число строк − 1) × (число столбцов − 1). Для таблицы 2×2 это (2−1) × (2−1) = 1. Это означает, что после того как известны итоговые суммы по строкам и столбцам и значение одной ячейки, все остальные значения полностью определяются, и остается только один свободный параметр.
Снижает ли поправка Йейтса статистическую мощность?
Да, более консервативный тест требует более сильных доказательств для отклонения нулевой гипотезы. Критики считают, что поправка Йейтса может чрезмерно корректировать результат, увеличивая риск ошибки второго рода (пропустить реальный эффект). Для больших выборок с высокими ожидаемыми частотами влияние поправки незначительно. Многие современные статистики предпочитают точный критерий Фишера для малых выборок 2×2.
Можно ли использовать этот калькулятор для таблиц больше чем 2×2?
Нет. Поправка Йейтса предназначена именно для таблиц сопряженности 2×2. Для более крупных таблиц (например, 3×2 или 3×3) используйте стандартный критерий хи-квадрат Пирсона без поправки на непрерывность. Формула и степени свободы для больших таблиц отличаются.