样本比例抽样分布计算器

计算任意样本比例抽样分布的均值、标准误、正态性条件、Z 分数和累计概率。

输入总体比例 (p) 和样本量 (n)。也可输入特定样本比例 (p̂),以获得对应的 Z 分数和累计概率。

样本比例抽样分布计算器
计算任意样本比例抽样分布的均值、标准误、正态性条件、Z 分数和累计概率。

关于样本比例的抽样分布

样本比例的抽样分布是一种理论分布,用来描述从真实比例为 p 的总体中抽取所有可能的固定样本量 n 的随机样本时,样本比例 (p̂) 可能取值的范围。它是推断统计的基础概念,支撑调查方法、假设检验和置信区间。 抽样分布的均值等于总体比例 p,体现了不偏性。其标准差称为比例的标准误,公式为 σ(p̂) = √[p(1–p)/n]。样本量 n 越大,标准误越小,样本比例越集中在真实值 p 附近。 根据中心极限定理,当 np ≥ 10 且 n(1–p) ≥ 10 时,抽样分布可近似为正态分布。这保证样本中的成功数和失败数都足够大。若条件不满足,通常在小样本或接近 0 或 1 的极端比例下,应使用二项分布。 若提供观测样本比例 p̂,计算器会计算 Z 分数:Z = (p̂ – p) / σ(p̂),表示 p̂ 距均值有多少个标准误。绝对值较大的 Z 分数说明在假定总体比例下该观测值由随机机会产生的可能性较低,是假设检验的基础。 累计概率 P(p̂ < x) 表示样本比例小于或等于 x 的概率;互补概率 P(p̂ > x) 表示大于 x 的概率。二者可用于判断观测样本比例相对于理论分布有多极端。 该概念用于民意调查、质量控制和医学研究,例如估计支持率超过阈值的概率、判断缺陷率是否超标,或评估治疗反应比例是否不同于历史基准。

抽样分布示例

三个场景展示均值、标准误、正态性检查和 Z 分数计算。

参数关键结果说明
p=0.60, n=100, p̂=0.65μ=0.60, σ=0.049, Z=1.02, P(<0.65)≈0.846满足正态性条件(np=60,n(1-p)=40)。观测到的 65% 约比总体比例高 1 个标准误。
p=0.50, n=400, p̂=0.53μ=0.50, σ=0.025, Z=1.20, P(<0.53)≈0.885大样本提高精度。样本量增加到四倍时,标准误减半,使偏离 0.50 的情况更容易被检测到。
p=0.05, n=50μ=0.05, σ=0.031, 正态性未通过np=2.5 < 10,因此正态性条件不满足。对于小比例和小样本,应改用精确二项分布。

如何使用抽样分布计算器

  1. 将总体比例 (p) 输入为 0 到 1 之间(不含端点)的小数。这是总体中已知或假定的真实比例。
  2. 将样本量 (n) 输入为正整数。它决定标准误,并决定是否满足正态性条件。
  3. 可选择输入样本比例 (p̂),以计算 Z 分数以及累计概率 P(p̂ < x) 和 P(p̂ > x)。
  4. 点击“计算”查看均值、标准误、正态性检查结果,以及(若提供 p̂)Z 分数和概率输出。
  5. 点击“重置”清空所有字段并开始新的计算。

比例抽样分布常见问题

样本比例的标准误是什么?
标准误是抽样分布的标准差,用于衡量不同样本之间样本比例的变动程度。它等于 √[p(1–p)/n]。标准误越小,样本比例越集中在真实总体比例 p 附近。
抽样分布什么时候近似正态?
当 np ≥ 10 且 n(1–p) ≥ 10 同时满足时,正态近似有效。如果任一条件不满足,分布会偏斜,基于正态近似的概率计算将不准确。此时应使用精确二项分布进行概率陈述。
增加样本量会如何影响分布?
增加 n 会按 1/√n 的比例降低标准误,从而使抽样分布变窄。无论样本量如何,均值仍等于 p。更窄的分布意味着样本比例更可能接近真实总体比例,使估计和推断更加精确。
样本比例的 Z 分数为 2 表示什么?
Z 分数为 2 表示观测样本比例 p̂ 比总体比例 p 高 2 个标准误。在正态近似下,纯由随机机会观察到这么大或更大的 Z 分数的概率约为 2.3%(单尾)。这是反对假定总体比例的强证据,但并非决定性证据。
这个计算器能处理接近 0 或 1 的比例吗?
计算器仍会计算结果,但当 np < 10 或 n(1–p) < 10 时会标记正态性条件未通过。对于极端比例(如 p = 0.02 或 p = 0.98),抽样分布会偏斜,应使用二项分布进行准确的概率计算。
比例的标准差和标准误有什么区别?
二元变量的总体标准差衡量单个观测值内部的变异:σ = √[p(1–p)]。比例的标准误衡量重复抽样中样本比例的变异:σ(p̂) = √[p(1–p)/n]。标准误小了 1/√n 倍,反映了多个观测取平均后的效果。