兩方差相等 F 檢定計算器

使用 F 檢定判斷兩個母體方差是否相等。取得 F 統計量、p 值、自由度與清楚的統計決策。

輸入每組的樣本方差與樣本數,設定顯著水準,即可立即查看兩個方差在統計上是否相等。

兩方差相等 F 檢定
檢定兩個獨立樣本是否具有相等的母體方差

第 1 組

第 2 組

關於兩方差相等的 F 檢定

兩方差相等的 F 檢定是一種經典統計程序,用於判斷兩個獨立母體是否具有相同方差。此檢定以 Ronald A. Fisher 爵士命名,常在套用雙樣本 t 檢定前作為診斷檢查,因為雙樣本 t 檢定假設兩組具有相等的母體方差。如果 F 檢定拒絕此假設,則應改用不要求方差相等的 Welch t 檢定。 檢定統計量是兩個樣本方差的比值:F = s₁² / s₂²。依慣例,會將較大的樣本方差置於分子,使 F ≥ 1,這會把所有臨界區域限制在 F 分布的上尾,並簡化解讀。虛無假設 H₀ 表示母體方差相等 (σ₁² = σ₂²),對立假設 H₁ 表示兩者不同 (σ₁² ≠ σ₂²)。自由度為 df₁ = n₁ − 1(分子)與 df₂ = n₂ − 1(分母),其中 n₁ 與 n₂ 是各自的樣本數。 評估顯著性時,會將計算出的 F 值與具有 (df₁, df₂) 自由度的 F 分布比較。對於雙尾檢定,p 值等於 2 × P(F > F_obs)。如果 p 值小於或等於所選顯著水準 α(通常為 0.05 或 0.01),則拒絕 H₀,並宣告方差有顯著差異。所選 α 下的臨界 F 值提供等價的決策邊界:若 F_obs > F_crit,則拒絕 H₀。 F 檢定有廣泛的實務應用。在製造業中,它可驗證兩條生產線製造的零件是否具有相等的尺寸變異性,這是假設流程一致的品質管制程序之前提。在臨床研究中,它檢查兩個治療組是否有相似的反應變異性,這會影響研究設計與解讀。在金融領域,它比較兩項資產或投資組合的波動率,為風險評估與分散策略提供資訊。在農業中,它評估兩種肥料是否產生同樣穩定產量的作物。 儘管 F 檢定具有檢定力,但它有一項重要限制:對偏離常態性非常敏感。兩個樣本都必須來自常態分布母體,檢定才有效。當常態性不確定時,分析人員通常偏好更穩健的 Levene 檢定或 Brown–Forsythe 檢定,這些方法以絕對偏差或中位數偏差取代相對於平均數的原始偏差。本計算器透過正則化不完全貝塔函數使用精確的 F 分布 CDF,產生與 R (var.test)、Python (scipy.stats.levene) 和 SPSS 一致的 p 值。

方差相等 F 檢定 — 範例

來自製造、教育與金融的三個完整範例。

輸入結果脈絡
s₁² = 0.34, n₁ = 25; s₂² = 0.29, n₂ = 25; α = 0.05F = 1.1724, p ≈ 0.6767 — 不拒絕 H₀兩台機器生產螺栓。螺栓直徑方差沒有顯著差異;兩台機器的一致性相當。
s₁² = 110, n₁ = 41; s₂² = 125, n₂ = 31; α = 0.05F = 1.1364, p ≈ 0.6679 — 不拒絕 H₀兩種教學方法。測驗分數方差在統計上相等;兩種方法產生的成果一致性相似。
s₁² = 5.2, n₁ = 100; s₂² = 4.8, n₂ = 100; α = 0.01F = 1.0833, p ≈ 0.6366 — 不拒絕 H₀比較兩檔股票的日報酬波動率。在 1% 水準下,沒有證據顯示風險特徵不同。
s₁² = 18, n₁ = 16; s₂² = 12, n₂ = 16; α = 0.10F = 1.5, p ≈ 0.3952 — 不拒絕 H₀兩種肥料下的植物高度。在 10% 水準下,植物生長方差沒有統計顯著差異。

如何使用方差相等 F 檢定計算器

  1. 輸入第 1 組的樣本方差 (s²)——也就是相對於組平均數的平均平方偏差——以及該組的觀測數 (n)。
  2. 在第 2 組欄位輸入相對應的方差與樣本數。
  3. 從下拉選單選擇顯著水準 α:0.01 (1%)、0.05 (5%) 或 0.10 (10%)。已發表研究中最常見的選擇是 0.05。
  4. 按一下「計算」。計算器會自動將較大的方差放在分子,計算 F = s_max²/s_min²,使用 F 分布計算雙尾 p 值,並顯示臨界 F 值。
  5. 解讀結果:如果 p 值 ≤ α,方差有顯著差異,應使用 Welch t 檢定,而不是標準等方差 t 檢定。否則,可假設方差相等。

方差相等 F 檢定 — 常見問題

方差相等的 F 檢定在檢定什麼?
它檢定虛無假設 H₀: σ₁² = σ₂²,相對於對立假設 H₁: σ₁² ≠ σ₂²。顯著結果 (p ≤ α) 代表兩個母體方差在統計上不同。非顯著結果表示資料與方差相等一致,但不能證明它們相等。
為什麼在雙樣本 t 檢定前使用 F 檢定?
合併雙樣本 t 檢定假設兩組具有相同的母體方差。如果此假設被違反,檢定可能產生不正確的 p 值。先執行 F 檢定可檢查此假設:如果 F 檢定顯著,請改用不假設方差相等的 Welch t 檢定。
方差相等 F 檢定有哪些假設?
兩個樣本都必須取自常態分布母體,且樣本彼此獨立。F 檢定對非常態性相當敏感,即使中度偏離也可能扭曲 p 值。如果常態性存疑,請改用 Levene 檢定或 Brown–Forsythe 檢定。
為什麼總是把較大的方差放在分子?
將較大的方差放在分子可確保 F ≥ 1,將臨界區域限制在 F 分布的上尾,並避免查詢下尾表。對於雙尾檢定,p 值便是 2 × P(F > F_obs),計算很直接。
如何解讀臨界 F 值?
臨界 F 值 (F_crit) 是切除 F 分布頂端 α/2 的值。如果計算出的 F 超過 F_crit,便在顯著水準 α 下拒絕 H₀。使用 p 值與使用臨界值永遠會得到相同決策;它們是摘要同一比較的兩種等價方式。
什麼時候應使用 Levene 檢定而不是 F 檢定?
當資料可能不符合常態分布時,Levene 檢定較佳,因為它對非常態性更穩健。常態性成立時,方差相等 F 檢定是最佳檢定,但偏斜或厚尾資料可能嚴重扭曲其第一型錯誤率。實務上,許多統計學家預設使用 Levene 檢定來避免此風險。