两方差相等 F 检验计算器
使用 F 检验判断两个总体方差是否相等。获取 F 统计量、p 值、自由度和清晰的统计决策。
输入两组的样本方差和样本量,设置显著性水平,即可立即查看两个方差在统计上是否相等。
两方差相等 F 检验
检验两个独立样本是否具有相等的总体方差
第 1 组
第 2 组
关于两方差相等的 F 检验
两方差相等的 F 检验是一种经典统计方法,用于判断两个独立总体是否具有相同方差。该检验以 Ronald A. Fisher 爵士命名,常在应用双样本 t 检验前作为诊断检查,因为双样本 t 检验假设两组具有相等的总体方差。如果 F 检验拒绝这一假设,则应改用不要求方差相等的 Welch t 检验。
检验统计量是两个样本方差的比值:F = s₁² / s₂²。按惯例,将较大的样本方差放在分子中,使 F ≥ 1,这样所有临界区域都位于 F 分布的上尾,解释也更简单。原假设 H₀ 表示总体方差相等 (σ₁² = σ₂²),备择假设 H₁ 表示二者不同 (σ₁² ≠ σ₂²)。自由度为 df₁ = n₁ − 1(分子)和 df₂ = n₂ − 1(分母),其中 n₁ 和 n₂ 分别为相应样本量。
评估显著性时,将计算得到的 F 值与具有 (df₁, df₂) 自由度的 F 分布进行比较。对于双尾检验,p 值等于 2 × P(F > F_obs)。如果 p 值小于或等于所选显著性水平 α(通常为 0.05 或 0.01),则拒绝 H₀,并认为方差存在显著差异。所选 α 下的临界 F 值提供了等价的决策边界:若 F_obs > F_crit,则拒绝 H₀。
F 检验有广泛的实际应用。在制造业中,它用于验证两条生产线生产的零件是否具有相同的尺寸变异性,这是许多假设流程一致的质量控制程序的前提。在临床研究中,它检查两个治疗组的反应变异性是否相似,这会影响研究设计和结果解释。在金融领域,它比较两项资产或投资组合的波动率,为风险评估和分散化策略提供依据。在农业中,它评估两种肥料是否能产生同等稳定产量的作物。
尽管 F 检验很有用,但它有一个重要限制:对偏离正态性的情况非常敏感。两个样本都必须来自正态分布总体,检验才有效。当正态性不确定时,分析人员通常更倾向使用更稳健的 Levene 检验或 Brown–Forsythe 检验,这些方法用绝对偏差或中位数偏差替代相对于均值的原始偏差。本计算器通过正则化不完全贝塔函数使用精确的 F 分布 CDF,生成与 R (var.test)、Python (scipy.stats.levene) 和 SPSS 一致的 p 值。
方差相等 F 检验 — 示例
来自制造、教育和金融的三个完整示例。
| 输入 | 结果 | 背景 |
|---|---|---|
| s₁² = 0.34, n₁ = 25; s₂² = 0.29, n₂ = 25; α = 0.05 | F = 1.1724, p ≈ 0.6767 — 不拒绝 H₀ | 两台机器生产螺栓。螺栓直径方差没有显著差异;两台机器的一致性相当。 |
| s₁² = 110, n₁ = 41; s₂² = 125, n₂ = 31; α = 0.05 | F = 1.1364, p ≈ 0.6679 — 不拒绝 H₀ | 两种教学方法。考试分数方差在统计上相等;两种方法产生的结果稳定性相似。 |
| s₁² = 5.2, n₁ = 100; s₂² = 4.8, n₂ = 100; α = 0.01 | F = 1.0833, p ≈ 0.6366 — 不拒绝 H₀ | 比较两只股票的日收益波动率。在 1% 水平下,没有证据表明风险特征不同。 |
| s₁² = 18, n₁ = 16; s₂² = 12, n₂ = 16; α = 0.10 | F = 1.5, p ≈ 0.3952 — 不拒绝 H₀ | 两种肥料下的植物高度。在 10% 水平下,植物生长方差没有统计显著差异。 |
如何使用方差相等 F 检验计算器
- 输入第 1 组的样本方差 (s²)——即相对于组均值的平均平方偏差——以及该组的观测数量 (n)。
- 在第 2 组字段中输入对应的方差和样本量。
- 从下拉菜单选择显著性水平 α:0.01 (1%)、0.05 (5%) 或 0.10 (10%)。已发表研究中最常见的选择是 0.05。
- 点击“计算”。计算器会自动将较大的方差放入分子,计算 F = s_max²/s_min²,使用 F 分布计算双尾 p 值,并显示临界 F 值。
- 解释结果:如果 p 值 ≤ α,则方差存在显著差异,应使用 Welch t 检验而不是标准等方差 t 检验。否则,可以假定方差相等。
方差相等 F 检验 — 常见问题
方差相等的 F 检验检验什么?
它检验原假设 H₀: σ₁² = σ₂²,与备择假设 H₁: σ₁² ≠ σ₂² 相对。显著结果 (p ≤ α) 表示两个总体方差在统计上不同。非显著结果表示数据与方差相等一致,但不能证明它们相等。
为什么在双样本 t 检验前使用 F 检验?
合并方差双样本 t 检验假设两组具有相同的总体方差。如果该假设被违反,检验可能产生不正确的 p 值。先运行 F 检验可检查这一假设:如果 F 检验显著,则改用不假设方差相等的 Welch t 检验。
方差相等 F 检验有哪些假设?
两个样本都必须来自正态分布总体,并且样本彼此独立。F 检验对非正态性相当敏感,即使中等程度的偏离也会扭曲 p 值。如果正态性可疑,请改用 Levene 检验或 Brown–Forsythe 检验。
为什么总是把较大的方差放在分子?
将较大方差放在分子可确保 F ≥ 1,使临界区域限制在 F 分布的上尾,并避免查下尾表。对于双尾检验,p 值随后就是 2 × P(F > F_obs),计算更直接。
如何解释临界 F 值?
临界 F 值 (F_crit) 是截去 F 分布上端 α/2 的值。如果计算得到的 F 超过 F_crit,则在显著性水平 α 下拒绝 H₀。使用 p 值和使用临界值总会得到相同决策,它们是概括同一比较的两种等价方式。
什么时候应使用 Levene 检验而不是 F 检验?
当数据可能不服从正态分布时,Levene 检验更合适,因为它对非正态性更稳健。正态性成立时,方差相等 F 检验是最优检验,但偏斜或厚尾数据可能严重扭曲其第一类错误率。实践中,许多统计学家默认使用 Levene 检验来避免这一风险。