Калькулятор точного критерия Фишера - таблица сопряжённости 2x2

Рассчитайте односторонние и двусторонние p-значения, а также отношение шансов для таблицы сопряжённости 2×2 с помощью точного критерия Фишера — идеально для малых выборок.

Введите четыре счётчика ячеек вашей таблицы 2×2 (группа × результат), затем нажмите «Рассчитать», чтобы получить точные p-значения и отношение шансов.

Точный критерий Фишера
Анализирует статистическую значимость таблицы сопряжённости 2×2
Исход 1Исход 2
Группа 1
Группа 2

О точном критерии Фишера

Точный критерий Фишера — это критерий статистической значимости для анализа таблиц сопряжённости 2×2. Разработанный сэром Рональдом А. Фишером в 1922 году, он определяет, существует ли неслучайная связь между двумя категориальными переменными — например, между группой лечения и исходом пациента. В отличие от критерия хи-квадрат, который является приближением и становится неточным при малых ожидаемых значениях ячеек, точный критерий Фишера вычисляет точную вероятность наблюдаемых данных (и всех более экстремальных конфигураций) с использованием гипергеометрического распределения. Критерий располагает данные в таблицу 2×2 с фиксированными маргинальными суммами (суммами строк и столбцов). При заданных маргиналах он вычисляет вероятность наблюдаемой конфигурации при нулевой гипотезе отсутствия связи. Вероятность конкретной таблицы с ячейками [a, b; c, d] задаётся гипергеометрической формулой: P = C(a+b, a) × C(c+d, c) / C(n, a+c), где n = a+b+c+d. p-значение получается суммированием вероятностей всех таблиц, не менее экстремальных, чем наблюдаемая. Для одностороннего p-значения 'экстремальный' означает таблицы, где связь направлена так же, как в наблюдаемой таблице. Для двустороннего p-значения — что подходит для большинства исследовательских задач — 'экстремальный' означает таблицы с вероятностью не большей, чем у наблюдаемой, с суммированием по обоим хвостам. Поэтому двустороннее p-значение более консервативно и чаще используется в опубликованных исследованиях. Отношение шансов количественно описывает силу связи: OR = (a × d) / (b × c). Отношение шансов, равное 1, означает отсутствие связи; значение больше 1 показывает, что Исход 1 более вероятен в Группе 1, чем в Группе 2; значение меньше 1 — обратное. Отношение шансов является ключевой мерой в исследованиях «случай-контроль», клинических испытаниях и генетических ассоциативных исследованиях. Точный критерий Фишера уместен всякий раз, когда ожидаемое значение в любой ячейке таблицы 2×2 меньше 5 — это порог, при котором приближение хи-квадрат становится ненадёжным. Типичные области применения включают клинические испытания, сравнивающие успех лечения между двумя группами, генетическую эпидемиологию для проверки связи аллеля с заболеванием, исследования в образовании, сравнивающие доли сдавших/не сдавших между двумя методами обучения, и маркетинговую аналитику, сравнивающую конверсии между двумя вариантами рекламы. Критерий является точным независимо от размера выборки, что делает его золотым стандартом для малых выборок в этих областях.

Точный критерий Фишера — примеры

Три реальных сценария, показывающих, как составить таблицу сопряжённости 2×2 и интерпретировать точные p-значения.

Таблица [a, b; c, d]Двустороннее pКонтекст
a=9, b=1, c=2, d=8 (n=20)p = 0.0350 (значимо)Испытание нового препарата: 9 из 10 пациентов в группе лечения улучшились против 2 из 10 в группе плацебо. Связь между лечением и улучшением статистически значима.
a=7, b=3, c=1, d=12 (n=23)p = 0.0189 (значимо)Генетика: у 7 из 10 носителей варианта гена есть заболевание против 1 из 13 без варианта. Ген значительно связан с заболеванием.
a=10, b=2, c=5, d=8 (n=25)p = 0.0840 (незначимо при 0.05)Методы обучения: 10 из 12 сдали при методе A против 5 из 13 при методе B. Разница незначима на уровне 5%.
a=4, b=100, c=0, d=110 (n=214)p = 0.0563 (погранично)A/B-тест рекламной кампании: 4 конверсии у объявления A против 0 у объявления B при примерно 110 показах каждого. Результат на грани значимости и требует проверки на большей выборке.

Как пользоваться калькулятором точного критерия Фишера

  1. Организуйте данные в таблицу сопряжённости 2×2: строки — две группы (Группа 1 и Группа 2), столбцы — два возможных исхода (Исход 1 и Исход 2).
  2. Введите счётчики для каждой ячейки: Ячейка A (Группа 1, Исход 1), Ячейка B (Группа 1, Исход 2), Ячейка C (Группа 2, Исход 1), Ячейка D (Группа 2, Исход 2). Все значения должны быть неотрицательными целыми числами.
  3. Нажмите «Рассчитать». Калькулятор перечислит все возможные таблицы 2×2 с теми же маргинальными суммами и просуммирует гипергеометрические вероятности для точных односторонних и двусторонних p-значений.
  4. Для большинства исследовательских задач смотрите двустороннее p-значение. Если p < 0,05, связь между двумя группами и двумя исходами статистически значима.
  5. Интерпретируйте отношение шансов: значения > 1 означают, что Исход 1 более вероятен в Группе 1; значения < 1 — что менее вероятен. Используйте кнопки с примерами под таблицей, чтобы увидеть работу критерия на реальных сценариях.

Точный критерий Фишера — FAQ

Когда следует использовать точный критерий Фишера вместо критерия хи-квадрат?
Используйте точный критерий Фишера всякий раз, когда ожидаемое значение в любой ячейке вашей таблицы 2×2 меньше 5, или когда общий объём выборки мал (n < 20 — распространённое правило большого пальца). Критерий хи-квадрат использует приближение, которое ломается при малых значениях, делая p-значения ненадёжными. Критерий Фишера всегда точен, поэтому его можно безопасно использовать при любом размере выборки.
Что означает двустороннее p-значение в критерии Фишера?
Двустороннее p-значение — это вероятность наблюдать таблицу столь же экстремальную, как ваша, или более экстремальную в любом направлении, если верна нулевая гипотеза об отсутствии связи. Под 'экстремальной' здесь понимается гипергеометрическая вероятность, не превышающая вероятность наблюдаемой таблицы. По соглашению p-значение < 0,05 означает статистическую значимость связи.
Что такое отношение шансов и как его интерпретировать?
Отношение шансов (OR) равно (a × d) / (b × c). OR = 1 означает, что Исход 1 одинаково вероятен в обеих группах — связи нет. OR > 1 означает, что Исход 1 более вероятен в Группе 1, чем в Группе 2; OR < 1 — что менее вероятен. Например, OR = 9 означает, что шансы Исхода 1 в Группе 1 в девять раз выше, чем в Группе 2, что указывает на сильную положительную связь.
В чём разница между односторонними и двусторонними p-значениями?
Одностороннее p-значение проверяет связь в одном конкретном направлении (например, что в Группе 1 выше частота Исхода 1, чем в Группе 2). Двустороннее p-значение проверяет любую связь независимо от направления. Если у вас не было заранее заданной направленной гипотезы до просмотра данных, двустороннее p-значение — правильный и более консервативный выбор.
Что такое маргинальные суммы и почему они должны быть фиксированы?
Маргинальные суммы — это суммы по строкам (a+b и c+d) и по столбцам (a+c и b+d) таблицы. Критерий Фишера условно предполагает, что эти суммы фиксированы, и это основа вывода точного гипергеометрического распределения. На практике маргиналы фиксируются дизайном исследования (например, заранее заданными размерами групп или общим числом событий).
Можно ли использовать точный критерий Фишера для таблиц больше 2×2?
Классический точный критерий Фишера определён для таблиц 2×2. Существуют обобщения для более крупных таблиц сопряжённости r×c (с использованием многомерного гипергеометрического распределения), но они вычислительно затратны. Для больших таблиц с малыми ожидаемыми значениями можно применять точный критерий к подтаблицам 2×2 или использовать точные тесты на основе моделирования Монте-Карло в статистическом ПО.