合并标准差计算器

计算两个独立样本的合并标准差

输入两组的样本量、均值和标准差,计算合并标准差、t 统计量和 Cohen's d。

合并标准差计算器
计算两个独立样本的合并标准差
样本 1
样本 2

关于合并标准差计算器

合并标准差是两个(或更多)独立样本标准差的加权平均值,用于比较具有相同总体方差的组。它是独立样本 t 检验以及许多其他推断统计方法的核心概念。 合并标准差的公式为:sp = √[((n₁−1)s₁² + (n₂−1)s₂²) / (n₁+n₂−2)],其中 n₁ 和 n₂ 为样本量,s₁ 和 s₂ 为样本标准差。分母 n₁+n₂−2 表示两样本比较的总自由度。 合并标准差假定方差齐性——即两个样本来自方差相同的总体。使用合并估计前应检查这一假设(例如使用 Levene 检验或 Bartlett 检验)。当方差不相等时,应优先使用 Welch t 检验,因为它不合并方差。 除了合并标准差,本计算器还提供合并方差 (sp²)、总自由度、两样本 t 统计量和作为标准化效应量的 Cohen's d。Cohen's d = (mean₁ − mean₂) / sp,用合并标准差为单位量化均值差异的实际意义。 Cohen's d 的常用判断标准:约 0.2 被视为小效应,0.5 为中等效应,0.8 或以上为大效应。这些阈值可帮助心理学、医学、教育和社会科学中的结果解释。 合并标准差还用于计算两个均值差的置信区间、在元分析中合并不同研究的效应量,以及在质量控制中汇总不同生产批次的变异性估计。 实际应用包括临床试验(比较治疗组与对照组)、产品分析中的 A/B 测试(比较转化率)、教育研究(比较不同班级测试分数的变异性)以及工业质量控制(合并多条生产线的缺陷率估计)。 请记住:合并标准差同时利用两组信息,因此比任一单个样本标准差都能更精确地估计共同总体标准差。

示例

这些示例展示了在不同两样本场景下如何计算合并标准差。

输入合并标准差背景
n₁=10, x̄₁=50, s₁=2; n₂=15, x̄₂=55, s₂=3sp ≈ 2.669样本量不相等,均值不同
n₁=20, x̄₁=30, s₁=4; n₂=20, x̄₂=35, s₂=4sp = 4.000样本量和标准差相等,纯平均
n₁=30, x̄₁=100, s₁=10; n₂=30, x̄₂=105, s₂=12sp ≈ 11.045样本较大,标准差相近
n₁=5, x̄₁=8, s₁=1.5; n₂=8, x̄₂=10, s₂=2sp ≈ 1.824小样本,权重偏向较大的组

如何使用此计算器

  1. 输入第一组的样本量 (n₁)、均值 (x̄₁) 和标准差 (s₁)。
  2. 输入第二组的对应数值 (n₂, x̄₂, s₂)。样本量必须至少为 2。
  3. 点击“计算”,得到合并标准差、合并方差、自由度、t 统计量和 Cohen's d。
  4. 在等方差假设下,将合并标准差解释为共同总体标准差的最佳估计。
  5. 结合 t 统计量和自由度查 t 分布表以判断统计显著性,或查看 Cohen's d 评估效应量。

常见问题

什么是合并标准差?
合并标准差 (sp) 将两个独立样本的方差估计合并为一个更精确的估计值。它是两个样本方差按自由度加权的平均值,并假定两个总体具有相同的潜在方差。
什么时候应使用合并标准差?
当你假定两组之间满足方差齐性时,例如经典的两样本 t 检验,可使用合并标准差。如果预检验(Levene、Bartlett)表明方差差异显著,应改用不要求方差相等的 Welch t 检验。
Cohen's d 是什么,如何解读?
Cohen's d 是一种标准化效应量,用合并标准差为单位表示均值差异。约 0.2、0.5 和 0.8 通常分别称为小、中、大效应。较大的 Cohen's d 表明两组相对于合并变异性而言分离较明显。
为什么公式要除以 n₁+n₂−2?
分母 n₁+n₂−2 表示估计两个样本均值所消耗的总自由度。使用自由度(而不是 n₁+n₂)可以得到总体方差的无偏估计。每个样本向合并估计贡献 nᵢ−1 个自由度。
合并标准差可以用于两个以上的组吗?
可以——合并标准差可扩展到 k 个组,公式为 sp = √[Σ(nᵢ−1)sᵢ² / Σ(nᵢ−1)]。这种推广用于 ANOVA,其中单个组内合并标准差(均方误差的平方根)作为共同方差估计。
样本量如何影响合并标准差?
样本量越大,在合并估计中的权重越高。如果 n₁ >> n₂,合并标准差会主要受第一个样本方差影响。这体现了更多数据能提供更可靠方差估计的原则,也意味着当某个样本大得多时,离群值或等方差假设违背会产生更大影响。