2つの分散の等質性 F検定計算機
F検定を使って2つの母分散が等しいかを判定します。F統計量、p値、自由度、明確な統計的判断を得られます。
各グループの標本分散と標本サイズを入力し、有意水準を設定すると、2つの分散が統計的に等しいかをすぐに確認できます。
2つの分散の等質性 F検定
2つの独立標本が等しい母分散を持つかを検定します
グループ 1
グループ 2
2つの分散の等質性 F検定について
2つの分散の等質性に関する F 検定は、2つの独立した母集団が同じ分散を持つかどうかを判定するための古典的な統計手法です。Sir Ronald A. Fisher にちなんで名付けられたこの検定は、2群の母分散が等しいことを仮定する2標本 t 検定を適用する前の診断チェックとして広く使われます。F 検定がその仮定を棄却する場合は、等分散を必要としない Welch の t 検定を代わりに使用すべきです。
検定統計量は2つの標本分散の比です: F = s₁² / s₂²。慣例として、より大きい標本分散を分子に置き、F ≥ 1 となるようにします。これにより、すべての臨界領域が F 分布の上側尾部に限定され、解釈が簡単になります。帰無仮説 H₀ は母分散が等しいこと (σ₁² = σ₂²) を表し、対立仮説 H₁ はそれらが異なること (σ₁² ≠ σ₂²) を表します。自由度は df₁ = n₁ − 1(分子)および df₂ = n₂ − 1(分母)で、n₁ と n₂ はそれぞれの標本サイズです。
有意性を評価するには、計算された F 値を自由度 (df₁, df₂) の F 分布と比較します。両側検定では、p値は 2 × P(F > F_obs) に等しくなります。p値が選択した有意水準 α(通常は 0.05 または 0.01)以下であれば H₀ を棄却し、分散は有意に異なると判断します。選択した α における臨界 F 値は同等の判断境界を提供します。つまり、F_obs > F_crit なら H₀ を棄却します。
F 検定には幅広い実用的用途があります。製造業では、2つの生産ラインが同じ寸法ばらつきの部品を生産しているかを確認し、工程が均一であることを仮定する品質管理手順の前提を検証します。臨床研究では、2つの治療群の反応のばらつきが同程度かを確認し、研究デザインと解釈の両方に影響します。金融では、2つの資産またはポートフォリオのボラティリティを比較し、リスク評価や分散投資戦略に役立てます。農業では、2種類の肥料が同じ収量安定性の作物を生むかを評価します。
F 検定は有力ですが、重要な制約があります。正規性からの逸脱に非常に敏感です。検定が妥当であるためには、両方の標本が正規分布する母集団から得られている必要があります。正規性が不確かな場合、分析者は多くの場合、平均からの生の偏差を絶対偏差または中央値偏差に置き換える、より頑健な Levene 検定または Brown–Forsythe 検定を好みます。この計算機は、正則化不完全ベータ関数による正確な F 分布 CDF を使用し、R (var.test)、Python (scipy.stats.levene)、SPSS と整合する p値を生成します。
分散の等質性 F検定 — 例
製造、教育、金融からの3つの例題です。
| 入力 | 結果 | 文脈 |
|---|---|---|
| s₁² = 0.34, n₁ = 25; s₂² = 0.29, n₂ = 25; α = 0.05 | F = 1.1724, p ≈ 0.6767 — H₀ を棄却しない | 2台の機械がボルトを製造しています。ボルト直径の分散に有意差はなく、どちらの機械も同程度に一貫しています。 |
| s₁² = 110, n₁ = 41; s₂² = 125, n₂ = 31; α = 0.05 | F = 1.1364, p ≈ 0.6679 — H₀ を棄却しない | 2つの教授法。テスト得点の分散は統計的に等しく、両方の方法は同程度に安定した成果を生みます。 |
| s₁² = 5.2, n₁ = 100; s₂² = 4.8, n₂ = 100; α = 0.01 | F = 1.0833, p ≈ 0.6366 — H₀ を棄却しない | 2銘柄の日次リターンのボラティリティを比較しています。1%水準では、リスク特性が異なる証拠はありません。 |
| s₁² = 18, n₁ = 16; s₂² = 12, n₂ = 16; α = 0.10 | F = 1.5, p ≈ 0.3952 — H₀ を棄却しない | 2種類の肥料による植物の高さ。10%水準では、植物成長の分散に統計的な差はありません。 |
分散の等質性 F検定計算機の使い方
- グループ 1 の標本分散 (s²)(グループ平均からの平均二乗偏差)と、そのグループの観測数 (n) を入力します。
- グループ 2 の欄に、対応する分散と標本サイズを入力します。
- ドロップダウンから有意水準 α を選択します: 0.01 (1%)、0.05 (5%)、または 0.10 (10%)。発表研究で最も一般的なのは 0.05 です。
- 「計算」をクリックします。計算機は自動的に大きい方の分散を分子に置き、F = s_max²/s_min² を計算し、F 分布を用いて両側 p値を求め、臨界 F 値を表示します。
- 結果を解釈します。p値 ≤ α の場合、分散は有意に異なるため、標準的な等分散 t 検定ではなく Welch の t 検定を使うべきです。それ以外の場合は、等分散を仮定できます。
分散の等質性 F検定 — FAQ
分散の等質性 F検定は何を検定しますか?
帰無仮説 H₀: σ₁² = σ₂² を、対立仮説 H₁: σ₁² ≠ σ₂² に対して検定します。有意な結果 (p ≤ α) は、2つの母分散が統計的に異なることを意味します。有意でない結果は、データが等分散と矛盾しないことを意味しますが、等しいことを証明するものではありません。
なぜ2標本 t 検定の前に F 検定を使うのですか?
プールされた2標本 t 検定は、両グループが同じ母分散を持つと仮定します。この仮定が破られると、検定は誤った p値を出す可能性があります。先に F 検定を行うことでこの仮定を確認できます。F 検定が有意であれば、等分散を仮定しない Welch の t 検定を使用します。
分散の等質性 F検定の仮定は何ですか?
両方の標本は正規分布する母集団から抽出され、標本同士は独立している必要があります。F 検定は非正規性にかなり敏感で、中程度の逸脱でも p値が歪むことがあります。正規性が疑わしい場合は、Levene 検定または Brown–Forsythe 検定を使用してください。
なぜ常に大きい分散を分子に置くのですか?
大きい分散を分子に置くことで F ≥ 1 となり、臨界領域を F 分布の上側尾部に限定でき、下側尾部表を参照する必要がなくなります。両側検定では、p値は単に 2 × P(F > F_obs) となり、計算が容易です。
臨界 F 値はどう解釈すればよいですか?
臨界 F 値 (F_crit) は、F 分布の上位 α/2 を切り落とす値です。計算された F が F_crit を超える場合、有意水準 α で H₀ を棄却します。p値を使う方法と臨界値を使う方法は常に同じ判断に至り、同じ比較を要約する2つの同等な方法です。
F 検定ではなく Levene 検定を使うべきなのはいつですか?
データが正規分布に従わない可能性がある場合は、非正規性に頑健な Levene 検定が望ましいです。正規性が成り立つとき、分散の等質性 F 検定は最適な検定ですが、歪んだデータや裾の重いデータでは第一種過誤率が大きく歪む可能性があります。実務では、このリスクを避けるため多くの統計家が Levene 検定を標準的に使用します。