样本均值抽样分布计算器
使用中心极限定理计算样本均值的概率——几秒内求出标准误、z 分数和精确概率。
输入总体均值、标准差和样本量,然后选择概率类型并填写样本均值,立即得到结果。
样本均值抽样分布计算器
使用中心极限定理计算样本均值的概率——几秒内求出标准误、z 分数和精确概率。
计算样本均值小于给定值 x₁ 的概率。
关于样本均值抽样分布计算器
样本均值的抽样分布描述的是:从同一总体中反复抽取相同样本量的随机样本时,样本均值如何从一个样本变化到另一个样本。它是推断统计中最重要的概念之一,因为它为置信区间、假设检验以及几乎所有科学和工业领域中的质量控制图提供了理论基础。
中心极限定理 (CLT) 是让这一分布变得有用的核心。CLT 表明,无论总体分布的形状如何,随着样本量 n 增大,样本均值的抽样分布都会趋近于正态分布。在实践中,样本量达到 30 或以上通常就足以得到很好的近似。如果总体本身已经服从正态分布,那么无论样本量多小,该结论都成立。
均值的标准误 (SE) 衡量抽样分布的离散程度。它等于总体标准差 σ 除以 n 的平方根:SE = σ / √n。样本量越大,SE 越小,这意味着更大的样本能更精确地估计总体均值。这也从数学上解释了为什么样本量翻倍会使标准误减半,以及为什么研究人员会投入更多数据收集来降低不确定性。
一旦知道标准误,任何样本均值 x̄ 都可以用 z = (x̄ − μ) / SE 转换为 z 分数。z 分数表示 x̄ 距离真实总体均值 μ 有多少个标准误。由于抽样分布近似正态,标准正态表——或其数学等价形式 Φ(z)——可以给出样本均值低于、高于或落在指定值之间的精确概率。
本计算器支持三种概率类型。第一种 P(X̄ < x) 给出容量为 n 的随机样本均值低于 x 的左尾概率。第二种 P(X̄ > x) 给出右尾(上尾)概率。第三种 P(x₁ < X̄ < x₂) 给出样本均值落在两个指定值之间的概率,计算方式是两个累积正态概率之差。
实际用途覆盖各个领域。质量工程师可以监控一批零部件的平均尺寸是否超出公差;营养师可以检验抽样群体的平均热量摄入是否可能来自已知平均值的总体;金融分析师可以估计一个季度内平均日收益超过阈值的概率;临床研究人员可以判断样本中的平均降压幅度反映真实总体效应的可能性。在每种情况下,本计算器都能通过一次计算给出概率答案。
抽样分布示例
展示如何应用抽样分布计算器的真实场景。
| 场景 | 概率 | 解释 |
|---|---|---|
| μ=80, σ=10, n=30, P(X̄ < 78) | ≈ 13.6% | 考试成绩:当真实均值为 80 时,30 名学生组成的班级平均分低于 78 的概率约为 14%。 |
| μ=1000, σ=50, n=40, P(X̄ > 1010) | ≈ 10.3% | 灯泡寿命:一批 40 个灯泡的平均寿命超过 1010 小时的概率约为 10%。 |
| μ=3, σ=0.5, n=50, P(2.9 < X̄ < 3.1) | ≈ 84.3% | 咖啡杯:样本均值落在总体均值 ±0.1 杯范围内的概率为 84%。 |
| μ=0.05, σ=1, n=100, P(X̄ < 0) | ≈ 30.9% | 股票收益:当真实均值为 0.05% 时,100 天平均收益为负的概率为 31%。 |
如何使用抽样分布计算器
- 输入总体均值 (μ)——整个总体的已知或假设平均值。
- 输入总体标准差 (σ)——必须为正数。
- 输入样本量 (n)——每个样本中的观测数量(整数 ≥ 2)。
- 选择概率类型:P(X̄ < x) 表示左尾概率,P(X̄ > x) 表示右尾概率,P(x₁ < X̄ < x₂) 表示区间概率。
- 输入样本均值并点击计算,即可查看标准误、z 分数和精确概率。
抽样分布常见问题
什么是样本均值的抽样分布?
它是从总体中反复抽取容量为 n 的随机样本时,所有可能样本均值形成的概率分布。中心极限定理保证,当 n 足够大时,该分布近似正态,其均值等于总体均值 μ,标准差等于标准误 SE = σ/√n。
什么是标准误?它与标准差有何不同?
标准差 (σ) 衡量单个数据点围绕总体均值的离散程度。标准误 (SE = σ/√n) 衡量样本均值围绕 μ 的离散程度。随着 n 增大,SE 会变小——样本越大,对均值的估计越精确。
什么时候可以使用这个计算器?
当你知道总体标准差 σ,且样本量 n 足够大、中心极限定理可以适用时(通常 n ≥ 30),即可使用。若总体本身服从正态分布,则任意 n 都有效。如果 σ 未知,应改用 t 分布。
这里的 z 分数如何计算?
z 分数按 z = (x̄ − μ) / SE 计算,其中 x̄ 是你输入的样本均值,μ 是总体均值,SE = σ/√n。它表示目标样本均值距离总体均值有多少个标准误,使标准正态表能够把这段距离转换为概率。
为什么样本量越大,概率分布的离散程度越小?
因为 SE = σ/√n,n 翻倍会使 SE 按 √2 ≈ 1.41 的因子下降。更小的 SE 意味着抽样分布更高、更窄,样本均值更集中在 μ 附近。因此,极端样本均值出现的可能性降低,置信区间也变短,这就是收集更多数据能提高估计精度的原因。
“介于两者之间”的概率模式计算什么?
区间模式计算 P(x₁ < X̄ < x₂)——随机样本均值严格落在 x₁ 与 x₂ 之间的概率。它按 Φ(z₂) − Φ(z₁) 计算,其中 z₁ 和 z₂ 分别是 x₁ 和 x₂ 对应的 z 分数。当你想知道样本均值落在总体均值周围可接受范围内的概率时,这很有用。