离散度计算器 - 方差、标准差与四分位距

从任意数值数据集中计算完整的离散程度指标——极差、方差、标准差、四分位距、变异系数和 MAD。

输入以逗号分隔的数字并点击“计算”,即可立即查看所有离散程度和中心趋势统计量。

离散度计算器 - 方差、标准差与四分位距
从任意数值数据集中计算完整的离散程度指标——极差、方差、标准差、四分位距、变异系数和 MAD。

关于离散度计算器

统计离散程度描述的是数据集中各个数值有多分散。中心趋势指标——平均值、中位数和众数——告诉你分布中心在哪里,而离散程度指标则告诉你各个数据点偏离这个中心有多远。两个数据集可能拥有相同的平均值,却呈现出截然不同的分布;正是离散程度指标揭示了这种差异。 极差是最简单的离散程度指标:最大值与最小值之差。它容易计算,也容易理解,但由于完全依赖两个极端值,因此对离群值非常敏感,并且会忽略中间的所有信息。 方差衡量与平均值之间平方偏差的平均值。样本方差会把平方偏差之和除以 (n−1)——使用贝塞尔校正,可在样本场景下对总体方差给出无偏估计。总体方差则除以 n,只适用于你的数据集本身就是所关注的完整总体。标准差是方差的平方根,单位与原始数据相同。 四分位距(IQR)衡量中间 50% 数据的跨度,计算方式为 Q3 − Q1,其中 Q1 是第 25 百分位,Q3 是第 75 百分位。由于它忽略了最低和最高 25% 的数值,IQR 对离群值更稳健,因此是偏态分布最常用的离散程度指标。 变异系数(CV)把样本标准差表示为均值的百分比,因此是一种无量纲指标,可用于比较不同单位或不同量级的数据集的相对变异性。CV 为 10% 表示标准差相当于均值的 10%——这是比较实验测量精度时很有用的基准。 中位数绝对偏差(MAD)是各数据点偏离中位数的绝对值的中位数。它比四分位距更能抵抗离群值,常用于稳健统计和异常检测。与 IQR 一样,MAD 对极端值不敏感,能够为重尾或偏态分布的数据集提供可靠的离散程度度量。

离散度计算器示例

三个真实世界的数据集,展示不同的离散模式。

数据集关键指标解读
85, 92, 78, 88, 76, 95, 89, 72平均值=84.375,SD≈8.19,IQR=12.25班级测验成绩。CV≈9.71% 表示相对离散程度中等。IQR 为 12.25,说明中间 50% 的学生成绩集中在 12 分的区间内。
1.2, -0.5, 2.1, 0.8, -1.9, 1.5, 2.5, -0.2, 0.3, 1.7, -1.1, 2.3平均值=0.725,SD≈1.40,IQR=2.075月度股票收益率(%)。较高的 CV(>100%)反映了相对于较小正均值回报的显著波动性。
502, 499, 505, 498, 501, 503, 497, 500平均值=500.625,SD≈2.67,CV≈0.53%质量控制批次中的产品重量(g)。极低的 CV 证明制造过程围绕 500 g 目标非常稳定。

如何使用离散度计算器

  1. 将数据值输入或粘贴到文本区域中,可用逗号、空格或换行分隔。
  2. 点击“计算”。计算器会解析数字,并忽略任何非数字内容。
  3. 查看中心趋势指标(数量、平均值、中位数),了解数据的中心位置。
  4. 检查离散度指标:极差看整体跨度,标准差看相对于平均值的平均偏离,IQR 看中间 50% 的跨度。
  5. 使用变异系数比较不同数据集的相对变异性,并使用 MAD 作为更稳健、抗离群值的离散程度指标。

离散度计算器常见问题

什么时候该用 IQR 而不是标准差?
当数据偏斜、包含离群值,或来自非正态分布时,应使用 IQR。IQR 只考虑中间 50% 的数据,不受极端值影响。标准差会把所有数值都纳入计算,因此一个离群值就可能让它明显增大。对于没有离群值的正态分布数据,这两种指标都很有参考价值。
样本方差和总体方差有什么区别?
总体方差用平方偏差之和除以 n(总数),适用于你拥有整个总体数据的情况。样本方差用 n−1(贝塞尔校正)作除数,用于从样本估计总体方差时的偏差修正。对于大样本,两者差异很小;对于小样本(n < 30),差异更明显。
变异系数告诉我什么?
变异系数(CV)把标准差表示为均值的百分比,因此提供了一种与尺度无关的相对变异性度量。CV 为 5% 表示数据相对稳定;CV 为 50% 表示相对于平均值,它的变动很大。CV 特别适合比较不同单位的测量值,例如比较两种制造流程的一致性。
中位数绝对偏差(MAD)是如何计算的?
MAD 是各数据点偏离中位数的绝对值的中位数:MAD = median(|xi − median(x)|)。它比标准差更能抵抗离群值,因为它使用的是偏差的中位数而不是平均值。常用的稳健标准差估计为 1.4826 × MAD,对于正态分布,这个值等于标准差。
为什么平均值和中位数可能差很多?
当平均值和中位数差异很大时,说明分布存在偏斜。平均值远大于中位数表示右偏(少数很大的值把平均值拉高)。平均值远小于中位数表示左偏。对于偏态分布,中位数通常比平均值更适合作为中心趋势指标,而 IQR 比标准差更适合作为离散程度指标。
这个计算器能处理非常大的数据集吗?
它可以处理你能输入的任何规模的数据集,但非常大的输入在解析时可能会较慢。为了获得最佳性能,建议使用单行逗号分隔值,或分布在多行中。计算使用数值稳定的算法,可避免典型数据范围内的溢出和下溢。如果你要分析数百万个数值,R 或 Python pandas 之类的专用统计软件会更高效。