F統計量計算機 - ANOVAと分散比検定
ANOVAまたはF比検定で2つの標本分散を比較するためのF統計量、自由度、p値、臨界F値を計算します。
各群の標本分散と標本サイズを入力し、有意水準を選ぶだけで、F統計量と明確な棄却/棄却しない判定が得られます。
F統計量計算機
F比検定を使って2群の分散を比較
グループ1のデータ
グループ2のデータ
F統計量計算機について
F統計量は2つの分散の比であり、群平均または群分散の差が統計的に有意かどうかを判断するために使われます。ロナルド・A・フィッシャー卿にちなんで名付けられ、分散分析(ANOVA)の中核をなすとともに、2つの分散の等質性を調べるF検定で重要な量です。ある群の値のばらつきが別の群と意味のある違いを持つか判断したいとき、F統計量は厳密で確率に基づく答えを与えます。
基本的には、F統計量は単に F = s₁² / s₂² です。ここで s₁² と s₂² は2つの独立した群の標本分散です。慣例として大きい方の分散を分子に置くため、F は常に ≥ 1 となり、関心のある確率質量はF分布の右側裾に限定されます。得られた値は、2つの自由度値 df₁ = n₁ − 1(分子)と df₂ = n₂ − 1(分母)で定まる理論的なF分布と比較されます。大きなF値は分散が大きく異なることを意味し、1に近いF値は分散が似ていることを意味します。
F分布は右に歪んでおり、非負の値だけを取ります。その正確な形状は df₁ と df₂ に依存します。両側検定(方向にかかわらず差があるかを調べる最も一般的なタイプ)では、p値は 2 × P(F > F_obs) として計算されます。ここで P(F > F_obs) は観測された統計量を超えるF分布右裾の面積です。このp値が選択した有意水準 α 以下であれば、帰無仮説 H₀: σ₁² = σ₂² を棄却し、分散は有意に異なると結論づけます。
ANOVAでは、F統計量はやや異なる形を取ります。すなわち、群間分散(群間平均平方、MSB)を群内分散(群内平均平方、MSW)で割った比です。すべての群平均が同一であれば、MSB と MSW はおおむね等しく、F ≈ 1 になります。群平均が離れるにつれて、MSB は MSW に対して大きくなり、F も増加して、最終的に臨界しきい値を超えます。
F統計量の一般的な用途には、製造業の品質管理(2台の機械は同じばらつきで部品を作っているか)、教育研究(2つの教授法は同程度に安定したテスト得点を生むか)、金融分析(2銘柄のボラティリティは似ているか)、農業科学(2つの肥料は同じ一貫性で作物収量をもたらすか)などがあります。2標本t検定を行う前に、多くの分析者はまずF検定で等分散の仮定を確認します。F検定が H₀ を棄却する場合は、Welchのt検定(等分散を仮定しない)がより適切です。
この計算機は正則化不完全ベータ関数を用いてF分布のCDF計算を自動化し、統計表を使わずに任意の正の自由度に対して正確なp値を返します。臨界F値はCDFを数値的に反転して求めます。どちらの出力も、R、Python(scipy)、SPSSが生成する値と一致します。
F統計量計算機の例
F検定を使って分散を比較する3つの実例です。
| 入力 | 結果 | 背景 |
|---|---|---|
| s₁² = 0.34, n₁ = 25; s₂² = 0.29, n₂ = 25; α = 0.05 | F = 1.1724, p ≈ 0.6767 — H₀を棄却しない | 2台の機械がボルトを製造しています。直径の分散は5%水準で有意に異なりません。 |
| s₁² = 110, n₁ = 41; s₂² = 135, n₂ = 31; α = 0.05 | F = 1.2273, p ≈ 0.5061 — H₀を棄却しない | 2つの教授法です。テスト得点の分散は有意に異ならず、どちらの方法も同程度の一貫性を示します。 |
| s₁² = 1.5, n₁ = 30; s₂² = 1.2, n₂ = 30; α = 0.01 | F = 1.25, p ≈ 0.5717 — H₀を棄却しない | 株式の日次リターン分散です。1%有意水準では、ボラティリティが異なる証拠はありません。 |
| s₁² = 550, n₁ = 50; s₂² = 620, n₂ = 50; α = 0.10 | F = 1.1273, p ≈ 0.5659 — H₀を棄却しない | 2種類の肥料による作物収量です。産出量の分散は10%水準で統計的に類似しています。 |
F統計量計算機の使い方
- 「グループ1のデータ」セクションに、グループ1の標本分散 (s²) と標本サイズ (n) を入力します。どちらも数値で、分散は ≥ 0、標本サイズは ≥ 2 でなければなりません。
- 「グループ2のデータ」セクションに、対応する分散と標本サイズを入力します。
- ドロップダウンから希望する有意水準 α を選択します。0.01、0.05、0.10 が標準的な3つの選択肢です。
- 「計算」をクリックします。計算機は大きい方の分散を分子に置き、F = s_max² / s_min² を計算し、自由度(df₁ = n_max − 1、df₂ = n_min − 1)を求め、両側p値と臨界F値を評価します。
- p値を α と比較します。p ≤ α なら H₀ を棄却し、分散は有意に異なると結論づけます。それ以外の場合は H₀ を棄却しません。「リセット」をクリックするとすべての入力欄が消去され、最初からやり直せます。
F統計量計算機FAQ
F統計量とは何ですか?
F統計量は2つの標本分散の比です:F = s₁² / s₂²。慣例として大きい方の分散を分子に置くため F ≥ 1 です。2つの母分散が等しいという帰無仮説の下では、df₁ = n₁ − 1 および df₂ = n₂ − 1 の自由度を持つF分布に従います。
F検定のp値は何を表しますか?
p値は、H₀(等分散)が真であると仮定したとき、計算された値と同じかそれ以上に極端なF統計量を観測する確率です。小さいp値(≤ α)は、このような大きな比が H₀ の下では起こりにくいことを意味するため、H₀ を棄却します。大きいp値は、データが等分散と整合していることを意味します。
片側F検定と両側F検定はいつ使い分けますか?
分散の差を方向に関係なく検出したい場合は、両側検定(ここでの既定)を使います。σ₁² > σ₂² のように事前の方向性仮説がある場合にのみ片側検定を使います。片側p値は、この計算機の両側p値を半分にしてください。
F検定の仮定は何ですか?
分散の等質性を調べるF検定では、両方の標本が正規分布する母集団から抽出され、標本が独立している必要があります。正規性に疑いがある場合は、非正規性により頑健なLevene検定またはBrown–Forsythe検定を検討してください。
臨界F値はどのように使いますか?
臨界F値 F_crit は、選択した α で H₀ を棄却するためのしきい値です。F_obs > F_crit なら H₀ を棄却します。臨界値による方法はp値による方法と等価であり、p値 < α のとき、かつそのときに限り F_obs > F_crit です。どちらの方法も常に同じ判定になります。
F検定とt検定の違いは何ですか?
t検定は2群の平均を比較し、F検定(2標本の文脈では)はそれらの分散を比較します。ANOVAでは、F統計量は群平均間の分散を群内分散と比較し、実質的にすべての群平均が等しいかを検定します。2標本t検定は、F値が t² に等しい特殊な場合と見ることができます。