Калькулятор точного критерия Фишера - таблица сопряжённости 2x2
Рассчитайте односторонние и двусторонние p-значения, а также отношение шансов для таблицы сопряжённости 2×2 с помощью точного критерия Фишера — идеально для малых выборок.
Введите четыре счётчика ячеек вашей таблицы 2×2 (группа × результат), затем нажмите «Рассчитать», чтобы получить точные p-значения и отношение шансов.
Точный критерий Фишера
Анализирует статистическую значимость таблицы сопряжённости 2×2
| Исход 1 | Исход 2 | |
|---|---|---|
| Группа 1 | ||
| Группа 2 |
О точном критерии Фишера
Точный критерий Фишера — это критерий статистической значимости для анализа таблиц сопряжённости 2×2. Разработанный сэром Рональдом А. Фишером в 1922 году, он определяет, существует ли неслучайная связь между двумя категориальными переменными — например, между группой лечения и исходом пациента. В отличие от критерия хи-квадрат, который является приближением и становится неточным при малых ожидаемых значениях ячеек, точный критерий Фишера вычисляет точную вероятность наблюдаемых данных (и всех более экстремальных конфигураций) с использованием гипергеометрического распределения.
Критерий располагает данные в таблицу 2×2 с фиксированными маргинальными суммами (суммами строк и столбцов). При заданных маргиналах он вычисляет вероятность наблюдаемой конфигурации при нулевой гипотезе отсутствия связи. Вероятность конкретной таблицы с ячейками [a, b; c, d] задаётся гипергеометрической формулой: P = C(a+b, a) × C(c+d, c) / C(n, a+c), где n = a+b+c+d. p-значение получается суммированием вероятностей всех таблиц, не менее экстремальных, чем наблюдаемая.
Для одностороннего p-значения 'экстремальный' означает таблицы, где связь направлена так же, как в наблюдаемой таблице. Для двустороннего p-значения — что подходит для большинства исследовательских задач — 'экстремальный' означает таблицы с вероятностью не большей, чем у наблюдаемой, с суммированием по обоим хвостам. Поэтому двустороннее p-значение более консервативно и чаще используется в опубликованных исследованиях.
Отношение шансов количественно описывает силу связи: OR = (a × d) / (b × c). Отношение шансов, равное 1, означает отсутствие связи; значение больше 1 показывает, что Исход 1 более вероятен в Группе 1, чем в Группе 2; значение меньше 1 — обратное. Отношение шансов является ключевой мерой в исследованиях «случай-контроль», клинических испытаниях и генетических ассоциативных исследованиях.
Точный критерий Фишера уместен всякий раз, когда ожидаемое значение в любой ячейке таблицы 2×2 меньше 5 — это порог, при котором приближение хи-квадрат становится ненадёжным. Типичные области применения включают клинические испытания, сравнивающие успех лечения между двумя группами, генетическую эпидемиологию для проверки связи аллеля с заболеванием, исследования в образовании, сравнивающие доли сдавших/не сдавших между двумя методами обучения, и маркетинговую аналитику, сравнивающую конверсии между двумя вариантами рекламы. Критерий является точным независимо от размера выборки, что делает его золотым стандартом для малых выборок в этих областях.
Точный критерий Фишера — примеры
Три реальных сценария, показывающих, как составить таблицу сопряжённости 2×2 и интерпретировать точные p-значения.
| Таблица [a, b; c, d] | Двустороннее p | Контекст |
|---|---|---|
| a=9, b=1, c=2, d=8 (n=20) | p = 0.0350 (значимо) | Испытание нового препарата: 9 из 10 пациентов в группе лечения улучшились против 2 из 10 в группе плацебо. Связь между лечением и улучшением статистически значима. |
| a=7, b=3, c=1, d=12 (n=23) | p = 0.0189 (значимо) | Генетика: у 7 из 10 носителей варианта гена есть заболевание против 1 из 13 без варианта. Ген значительно связан с заболеванием. |
| a=10, b=2, c=5, d=8 (n=25) | p = 0.0840 (незначимо при 0.05) | Методы обучения: 10 из 12 сдали при методе A против 5 из 13 при методе B. Разница незначима на уровне 5%. |
| a=4, b=100, c=0, d=110 (n=214) | p = 0.0563 (погранично) | A/B-тест рекламной кампании: 4 конверсии у объявления A против 0 у объявления B при примерно 110 показах каждого. Результат на грани значимости и требует проверки на большей выборке. |
Как пользоваться калькулятором точного критерия Фишера
- Организуйте данные в таблицу сопряжённости 2×2: строки — две группы (Группа 1 и Группа 2), столбцы — два возможных исхода (Исход 1 и Исход 2).
- Введите счётчики для каждой ячейки: Ячейка A (Группа 1, Исход 1), Ячейка B (Группа 1, Исход 2), Ячейка C (Группа 2, Исход 1), Ячейка D (Группа 2, Исход 2). Все значения должны быть неотрицательными целыми числами.
- Нажмите «Рассчитать». Калькулятор перечислит все возможные таблицы 2×2 с теми же маргинальными суммами и просуммирует гипергеометрические вероятности для точных односторонних и двусторонних p-значений.
- Для большинства исследовательских задач смотрите двустороннее p-значение. Если p < 0,05, связь между двумя группами и двумя исходами статистически значима.
- Интерпретируйте отношение шансов: значения > 1 означают, что Исход 1 более вероятен в Группе 1; значения < 1 — что менее вероятен. Используйте кнопки с примерами под таблицей, чтобы увидеть работу критерия на реальных сценариях.
Точный критерий Фишера — FAQ
Когда следует использовать точный критерий Фишера вместо критерия хи-квадрат?
Используйте точный критерий Фишера всякий раз, когда ожидаемое значение в любой ячейке вашей таблицы 2×2 меньше 5, или когда общий объём выборки мал (n < 20 — распространённое правило большого пальца). Критерий хи-квадрат использует приближение, которое ломается при малых значениях, делая p-значения ненадёжными. Критерий Фишера всегда точен, поэтому его можно безопасно использовать при любом размере выборки.
Что означает двустороннее p-значение в критерии Фишера?
Двустороннее p-значение — это вероятность наблюдать таблицу столь же экстремальную, как ваша, или более экстремальную в любом направлении, если верна нулевая гипотеза об отсутствии связи. Под 'экстремальной' здесь понимается гипергеометрическая вероятность, не превышающая вероятность наблюдаемой таблицы. По соглашению p-значение < 0,05 означает статистическую значимость связи.
Что такое отношение шансов и как его интерпретировать?
Отношение шансов (OR) равно (a × d) / (b × c). OR = 1 означает, что Исход 1 одинаково вероятен в обеих группах — связи нет. OR > 1 означает, что Исход 1 более вероятен в Группе 1, чем в Группе 2; OR < 1 — что менее вероятен. Например, OR = 9 означает, что шансы Исхода 1 в Группе 1 в девять раз выше, чем в Группе 2, что указывает на сильную положительную связь.
В чём разница между односторонними и двусторонними p-значениями?
Одностороннее p-значение проверяет связь в одном конкретном направлении (например, что в Группе 1 выше частота Исхода 1, чем в Группе 2). Двустороннее p-значение проверяет любую связь независимо от направления. Если у вас не было заранее заданной направленной гипотезы до просмотра данных, двустороннее p-значение — правильный и более консервативный выбор.
Что такое маргинальные суммы и почему они должны быть фиксированы?
Маргинальные суммы — это суммы по строкам (a+b и c+d) и по столбцам (a+c и b+d) таблицы. Критерий Фишера условно предполагает, что эти суммы фиксированы, и это основа вывода точного гипергеометрического распределения. На практике маргиналы фиксируются дизайном исследования (например, заранее заданными размерами групп или общим числом событий).
Можно ли использовать точный критерий Фишера для таблиц больше 2×2?
Классический точный критерий Фишера определён для таблиц 2×2. Существуют обобщения для более крупных таблиц сопряжённости r×c (с использованием многомерного гипергеометрического распределения), но они вычислительно затратны. Для больших таблиц с малыми ожидаемыми значениями можно применять точный критерий к подтаблицам 2×2 или использовать точные тесты на основе моделирования Монте-Карло в статистическом ПО.