Калькулятор F-теста равенства двух дисперсий
Определите, равны ли две генеральные дисперсии, с помощью F-теста. Получите F-статистику, p-значение, степени свободы и ясное статистическое решение.
Введите выборочную дисперсию и размер выборки для каждой группы, задайте уровень значимости и сразу узнайте, являются ли две дисперсии статистически равными.
F-тест равенства двух дисперсий
Проверка того, имеют ли две независимые выборки равные генеральные дисперсии
Группа 1
Группа 2
О F-тесте равенства двух дисперсий
F-тест равенства двух дисперсий — это классическая статистическая процедура, используемая для определения того, имеют ли две независимые генеральные совокупности одинаковую дисперсию. Тест, названный в честь сэра Рональда А. Фишера, широко применяется как диагностическая проверка перед двухвыборочным t-тестом, который предполагает равенство генеральных дисперсий в двух группах. Если F-тест отвергает это предположение, вместо него следует использовать t-тест Уэлча, который не требует равенства дисперсий.
Тестовая статистика представляет собой отношение двух выборочных дисперсий: F = s₁² / s₂². По соглашению большая выборочная дисперсия помещается в числитель, чтобы F ≥ 1; это ограничивает всю критическую область верхним хвостом F-распределения и упрощает интерпретацию. Нулевая гипотеза H₀ утверждает, что генеральные дисперсии равны (σ₁² = σ₂²), а альтернативная гипотеза H₁ — что они различаются (σ₁² ≠ σ₂²). Степени свободы равны df₁ = n₁ − 1 (числитель) и df₂ = n₂ − 1 (знаменатель), где n₁ и n₂ — соответствующие размеры выборок.
Для оценки значимости рассчитанное F-значение сравнивается с F-распределением с (df₁, df₂) степенями свободы. Для двустороннего теста p-значение равно 2 × P(F > F_obs). Если p-значение меньше или равно выбранному уровню значимости α (обычно 0.05 или 0.01), H₀ отклоняется, и дисперсии объявляются значимо различными. Критическое F-значение при выбранном α дает эквивалентную границу решения: если F_obs > F_crit, отклонить H₀.
F-тест имеет широкое практическое применение. В производстве он проверяет, выпускают ли две производственные линии детали с одинаковой размерной вариабельностью — это предпосылка для процедур контроля качества, предполагающих единообразные процессы. В клинических исследованиях он проверяет, имеют ли две группы лечения сходную вариабельность отклика, что влияет как на дизайн исследования, так и на интерпретацию. В финансах он сравнивает волатильность двух активов или портфелей, помогая оценке риска и стратегиям диверсификации. В сельском хозяйстве он оценивает, дают ли два удобрения культуры с одинаковой стабильностью урожайности.
Несмотря на свою мощность, F-тест имеет важное ограничение: он очень чувствителен к отклонениям от нормальности. Обе выборки должны происходить из нормально распределенных совокупностей, чтобы тест был валиден. Когда нормальность сомнительна, аналитики часто предпочитают более устойчивый тест Левена или тест Брауна–Форсайта, которые заменяют исходные отклонения от среднего абсолютными отклонениями или отклонениями от медианы. Этот калькулятор использует точную CDF F-распределения через регуляризованную неполную бета-функцию, выдавая p-значения, согласующиеся с R (var.test), Python (scipy.stats.levene) и SPSS.
F-тест равенства дисперсий — примеры
Три разобранных примера из производства, образования и финансов.
| Ввод | Результат | Контекст |
|---|---|---|
| s₁² = 0.34, n₁ = 25; s₂² = 0.29, n₂ = 25; α = 0.05 | F = 1.1724, p ≈ 0.6767 — не отклонять H₀ | Две машины производят болты. Дисперсии диаметров болтов не различаются значимо; обе машины одинаково стабильны. |
| s₁² = 110, n₁ = 41; s₂² = 125, n₂ = 31; α = 0.05 | F = 1.1364, p ≈ 0.6679 — не отклонять H₀ | Два метода обучения. Дисперсии результатов тестов статистически равны; оба метода дают сходную стабильность результатов. |
| s₁² = 5.2, n₁ = 100; s₂² = 4.8, n₂ = 100; α = 0.01 | F = 1.0833, p ≈ 0.6366 — не отклонять H₀ | Две акции сравниваются по волатильности дневной доходности. На уровне 1% нет доказательств различия профилей риска. |
| s₁² = 18, n₁ = 16; s₂² = 12, n₂ = 16; α = 0.10 | F = 1.5, p ≈ 0.3952 — не отклонять H₀ | Высота растений при двух удобрениях. Дисперсия роста растений статистически не отличается на уровне 10%. |
Как пользоваться калькулятором F-теста равенства дисперсий
- Введите выборочную дисперсию (s²) для группы 1 — среднее квадратическое отклонение от среднего группы — вместе с числом наблюдений (n) в этой группе.
- Введите соответствующую дисперсию и размер выборки для группы 2 в полях группы 2.
- Выберите уровень значимости α из раскрывающегося списка: 0.01 (1%), 0.05 (5%) или 0.10 (10%). В опубликованных исследованиях чаще всего выбирают 0.05.
- Нажмите «Рассчитать». Калькулятор автоматически помещает большую дисперсию в числитель, вычисляет F = s_max²/s_min², рассчитывает двустороннее p-значение по F-распределению и показывает критическое F-значение.
- Интерпретируйте результат: если p-значение ≤ α, дисперсии значимо различаются, и следует использовать t-тест Уэлча вместо стандартного t-теста с равными дисперсиями. В противном случае можно предполагать равенство дисперсий.
F-тест равенства дисперсий — FAQ
Что проверяет F-тест равенства дисперсий?
Он проверяет нулевую гипотезу H₀: σ₁² = σ₂² против альтернативы H₁: σ₁² ≠ σ₂². Значимый результат (p ≤ α) означает, что две генеральные дисперсии статистически различаются. Незначимый результат означает, что данные согласуются с равенством дисперсий, но не доказывает, что они равны.
Почему F-тест используют перед двухвыборочным t-тестом?
Объединенный двухвыборочный t-тест предполагает, что обе группы имеют одинаковую генеральную дисперсию. Если это предположение нарушено, тест может давать неправильные p-значения. Предварительный F-тест проверяет это предположение: если F-тест значим, используйте t-тест Уэлча, который не предполагает равенства дисперсий.
Каковы предположения F-теста равенства дисперсий?
Обе выборки должны быть получены из нормально распределенных совокупностей, а сами выборки должны быть независимы друг от друга. F-тест довольно чувствителен к ненормальности: даже умеренные отклонения могут исказить p-значение. Если нормальность сомнительна, используйте тест Левена или тест Брауна–Форсайта.
Почему большая дисперсия всегда помещается в числитель?
Размещение большей дисперсии в числителе обеспечивает F ≥ 1, что ограничивает критическую область верхним хвостом F-распределения и устраняет необходимость обращаться к таблице нижнего хвоста. Для двустороннего теста p-значение тогда просто равно 2 × P(F > F_obs), что легко вычислить.
Как интерпретировать критическое F-значение?
Критическое F-значение (F_crit) — это значение, отсекающее верхние α/2 F-распределения. Если рассчитанное F превышает F_crit, вы отклоняете H₀ на уровне значимости α. Использование p-значения и критического значения всегда приводит к одному и тому же решению — это два эквивалентных способа обобщить одно сравнение.
Когда следует использовать тест Левена вместо F-теста?
Тест Левена предпочтителен, когда данные могут не следовать нормальному распределению, поскольку он устойчив к ненормальности. F-тест равенства дисперсий оптимален при выполнении нормальности, но его уровень ошибки I рода может сильно искажаться из-за скошенных данных или данных с тяжелыми хвостами. На практике многие статистики по умолчанию используют тест Левена, чтобы избежать этого риска.