F統計量計算器 - ANOVA與變異數比檢定
計算在ANOVA或F比率檢定中比較兩個樣本變異數所需的F統計量、自由度、p值與臨界F值。
輸入每組的樣本變異數和樣本數,選擇顯著水準,即可取得F統計量以及清楚的拒絕/不拒絕結論。
F統計量計算器
使用F比率檢定比較兩組變異數
第1組資料
第2組資料
關於F統計量計算器
F統計量是兩個變異數的比值,用於判斷組平均數或組變異數之間的差異是否具有統計顯著性。它以羅納德·A·費雪爵士命名,是變異數分析(ANOVA)的核心,也是檢定兩個變異數是否相等的F檢定中的關鍵統計量。每當你需要判斷一組數值的離散程度是否與另一組有實質差異時,F統計量都能提供嚴謹、以機率為基礎的答案。
就核心而言,F統計量就是 F = s₁² / s₂²,其中 s₁² 和 s₂² 是兩個獨立組的樣本變異數。依慣例,較大的變異數會放在分子,使 F 一律 ≥ 1,並將關注的機率質量限制在F分布的右尾。接著將所得值與由兩個自由度值決定的理論F分布比較:df₁ = n₁ − 1(分子)和 df₂ = n₂ − 1(分母)。較大的F值表示變異數差異很大;接近1的F值表示它們相似。
F分布右偏且只取非負值。其精確形狀取決於 df₁ 和 df₂。對於雙尾檢定(最常見的類型,用於檢查不論方向的任何差異),p值計算為 2 × P(F > F_obs),其中 P(F > F_obs) 是觀察統計量右側F分布右尾的面積。如果此p值小於或等於你選擇的顯著水準 α,就拒絕虛無假設 H₀: σ₁² = σ₂²,並得出變異數有顯著差異的結論。
在ANOVA中,F統計量採取略為不同的形式:它是組間變異數(組間均方,MSB)與組內變異數(組內均方,MSW)的比值。如果各組平均數完全相同,MSB 和 MSW 應大致相等,因此 F ≈ 1。隨著組平均數分歧,MSB 相對於 MSW 增長,F 也會增加,最後超過臨界門檻。
F統計量的常見應用包括製造業品質管制(兩台機器生產的零件是否具有相同變異性?)、教育研究(兩種教學方法是否帶來同樣穩定的測驗成績?)、金融分析(兩檔股票是否有相似波動性?)以及農業科學(兩種肥料是否讓作物產量具有相同一致性?)。在執行雙樣本t檢定前,許多分析人員會先使用F檢定驗證等變異數假設;如果F檢定拒絕 H₀,則Welch t檢定(不等變異數)更為適合。
本計算器使用正則化不完全貝塔函數自動計算F分布CDF,無需查統計表,即可針對任何正自由度提供準確的p值。臨界F值則透過數值反轉CDF取得。兩項輸出均與 R、Python(scipy)和 SPSS 產生的值一致。
F統計量計算器範例
三個真實情境,展示如何套用F檢定來比較變異數。
| 輸入 | 結果 | 脈絡 |
|---|---|---|
| s₁² = 0.34, n₁ = 25; s₂² = 0.29, n₂ = 25; α = 0.05 | F = 1.1724, p ≈ 0.6767 — 不拒絕 H₀ | 兩台機器生產螺栓。直徑變異數在5%水準下沒有顯著差異。 |
| s₁² = 110, n₁ = 41; s₂² = 135, n₂ = 31; α = 0.05 | F = 1.2273, p ≈ 0.5061 — 不拒絕 H₀ | 兩種教學方法。測驗分數變異數沒有顯著差異;兩種方法產生的穩定性相似。 |
| s₁² = 1.5, n₁ = 30; s₂² = 1.2, n₂ = 30; α = 0.01 | F = 1.25, p ≈ 0.5717 — 不拒絕 H₀ | 股票日報酬率變異數。在1%顯著水準下,沒有證據顯示波動性不同。 |
| s₁² = 550, n₁ = 50; s₂² = 620, n₂ = 50; α = 0.10 | F = 1.1273, p ≈ 0.5659 — 不拒絕 H₀ | 兩種肥料的作物產量。產出變異數在10%水準下統計上相似。 |
如何使用F統計量計算器
- 在「第1組資料」區塊輸入第1組的樣本變異數 (s²) 和樣本數 (n)。兩個值都必須是數字:變異數 ≥ 0,樣本數 ≥ 2。
- 在「第2組資料」區塊輸入第2組對應的變異數和樣本數。
- 從下拉選單選擇所需的顯著水準 α — 0.01、0.05 或 0.10 是三個標準選項。
- 按一下「計算」。計算器會將較大的變異數放在分子,計算 F = s_max² / s_min²,推導自由度(df₁ = n_max − 1,df₂ = n_min − 1),並評估雙尾p值和臨界F值。
- 將p值與 α 比較。如果 p ≤ α,則拒絕 H₀,並得出變異數有顯著差異的結論。否則,不拒絕 H₀。按一下「重設」可清除所有欄位並重新開始。
F統計量計算器常見問題
什麼是F統計量?
F統計量是兩個樣本變異數的比值:F = s₁² / s₂²。依慣例,較大的變異數放在分子,因此 F ≥ 1。在兩個母體變異數相等的虛無假設下,它服從自由度為 df₁ = n₁ − 1 和 df₂ = n₂ − 1 的F分布。
F檢定中的p值代表什麼?
p值是在假設 H₀(變異數相等)為真時,觀察到與計算結果同樣極端或更極端的F統計量的機率。較小的p值(≤ α)表示如此大的比值在 H₀ 下不太可能出現,因此拒絕 H₀。較大的p值表示資料與變異數相等相符。
什麼時候應使用單尾或雙尾F檢定?
當你想偵測變異數之間不論方向的任何差異時,請使用雙尾檢定(此處預設)。只有在事先有方向性假設時才使用單尾檢定,例如 σ₁² > σ₂²。若要取得單尾p值,可將本計算器的雙尾p值減半。
F檢定有哪些假設?
用於檢定變異數相等的F檢定要求兩個樣本皆來自常態分布母體,且樣本彼此獨立。如果常態性存疑,可考慮Levene檢定或Brown–Forsythe檢定,它們對非常態性更穩健。
臨界F值如何使用?
臨界F值 F_crit 是在所選 α 下拒絕 H₀ 的門檻。如果 F_obs > F_crit,則拒絕 H₀。臨界值方法等同於p值方法:當且僅當 p值 < α 時,F_obs > F_crit。兩種方法總是給出相同決策。
F檢定和t檢定有什麼差異?
t檢定比較兩組的平均數,而F檢定(在雙樣本情境中)比較兩組的變異數。在ANOVA中,F統計量比較組平均數之間的變異與組內變異,實質上是在檢定所有組平均數是否相等。雙樣本t檢定可視為F值等於 t² 的特殊情況。