频率分布计算器 - 创建表格

从任意数据集快速生成完整的频率分布表,立即获取组距、频数、相对频数、累计频数和关键统计指标。

将数字用逗号、空格或换行分隔后粘贴或输入,选择组数,然后点击“计算”即可生成完整的频率表和摘要。

频率分布计算器
将数据按组距整理为分组区间,并计算频数与统计量

数字之间可用逗号、空格或换行分隔。

关于频率分布计算器

频率分布是一种表格式摘要,用来显示数据集中每个数值——或某个数值范围——出现的频率。通过把原始数据整理成若干易于处理的组区间,并统计每个区间中的观测值,频率分布表能把无序的数字列表转化为结构化的图景,展示数据的形状、中心和离散程度。频率分布是描述统计学的基础概念,也是直方图、相对频率多边形和累计频率曲线的依据。 分组频率分布会将数据范围划分为固定数量、互不重叠且宽度相等的组区间。每个区间都有下界、上界和组中点。频数是落入该区间的数据点数量。相对频数是把频数表示为总数的比例(或百分比),便于比较不同规模数据集之间的分布。累计频数则是从第一组到当前组的频数累加,显示有多少数据点位于每个组界限及其以下。 组数的选择需要平衡:组数太少会把不同模式合并成一团,组数太多又会把数据切得过细,难以看出清晰规律。常用经验法则是 Sturges 公式:k = 1 + 3.322 × log₁₀(n),其中 n 为数据点数量。例如,20 个数据点建议约 5 组;100 个数据点建议约 7 组。组距通常计算为 width = (max − min) / k,再向上取整到便于使用的数值,以确保所有数据点都能整齐落入区间。 由频率分布导出的摘要统计量是基于分组数据的近似值,而不是基于每个原始值。分组均值的计算方式为 Σ(组中点 × 频数) / n。分组标准差衡量数据围绕分组均值的离散程度。分组中位数则通过对包含第 n/2 个观测值的组区间进行插值估计。当组距相对于范围较小时,这些近似值通常非常接近由原始数据计算出的精确值。 频率分布广泛应用于各种产生数值数据的领域。教育工作者用它分析班级考试成绩,并找出可能需要额外支持的学生。企业用它分析销售交易金额、产品评分或客户等待时间,以识别高峰和瓶颈。医疗研究人员会对血压、胆固醇或 BMI 等临床指标进行分布分析,以了解人群健康状况。质量控制工程师会检查生产过程中的测量数据,以发现缺陷或漂移。在每种场景中,频率分布表都是更高级分析的起点。

频率分布——示例

三个实用数据集,展示不同的组结构和摘要统计。

数据集结构背景
82,90,75,68,88,75,95,100,72,85,91,78,84,88,77,95,65,80,73,86 — 5 个组组区间:[65,72), [72,79), [79,86) …;均值 ≈ 82.85某班 20 名学生的考试成绩。组距 = 7。多数成绩集中在 72–93 区间,略带左尾。
150,220,180,190,250,160,200,210,170,240,195,175,215,185,230 — 6 个组组区间:[150,170), [170,190), [190,210) …;均值 ≈ 202.7每日销售额数据。组距 = 20。分布显示大多数日期集中在 170–230 美元区间。
35,42,38,50,45,48,36,39,47,41,43,46,40,37,44,49,38,42,45,36 — 5 个组组区间:[35,38), [38,41), [41,44) …;均值 ≈ 42.1植物高度(厘米)的植物学研究数据。钟形分布表明生长模式大致符合正态分布。

如何使用频率分布计算器

  1. 在“数据集”字段中输入数值数据。你可以用逗号、空格或换行分隔数值,计算器支持这些分隔符的任意组合。
  2. 选择最适合数据集的组数(区间数)。小数据集(n < 30)可先用 5 组,较大的数据集可用 7–10 组。也可以使用 Sturges 公式:k ≈ 1 + 3.322 × log₁₀(n)。
  3. 点击“计算”。计算器会找出最小值和最大值,把组距计算为 (max − min) / classes 并向上取整,然后将每个数据点分配到相应区间。
  4. 查看频率表。每一行都会显示组区间、组中点、频数、相对频数(占总数的百分比)以及累计频数(运行总和)。
  5. 查看表格下方的摘要统计量,了解分组均值、中位数、标准差和组距。你还可以使用示例加载按钮来测试预填数据集。

频率分布计算器——常见问题

什么是频率分布表?
频率分布表会把原始数值数据整理成称为组区间(或 bins)的分组,并统计每组中有多少个值。它把无序列表转化为结构化摘要,展示数据点聚集的位置、分散程度以及分布的大致形状。
如何选择组数?
常见方法是使用 Sturges 公式:k = 1 + 3.322 × log₁₀(n),其中 n 是样本量。这样 20 个数据点大约对应 5 组,100 个数据点大约对应 7 组。你也可以直接试验:先从 5 组开始,逐步增加,直到分布显示出清晰模式且不过于杂乱。多数教材建议使用 5–15 组。
什么是相对频数,为什么它有用?
相对频数是某一组中观测值占总观测数的比例:相对频数 = 该组频数 / 总 n。它把计数转换为百分比,便于比较不同规模的数据集。例如,在比较两个不同规模的班级时,知道 35% 的考试成绩落在 70–80 区间,比只知道人数更有参考价值。
什么是累计频数?
累计频数是从第一组到当前组的频数累加。它告诉你有多少数据点位于每组上界及以下。例如,如果第三组结束时的累计频数是 15/20,那么 75% 的观测值落在前三组。累计频数是 ogive(累计频率曲线)的基础。
为什么均值和标准差标注为“分组”?
当数据被分到各个组区间时,原始单个数值会丢失。分组均值和标准差是用每组的组中点作为代表值计算的,因此会带来轻微近似。当组距相对于范围较小时,这些估计非常准确,但与基于原始数据计算的统计量可能略有差异。
频数直方图和相对频数直方图有什么区别?
频数直方图在 y 轴上绘制原始计数,而相对频数直方图绘制比例(或百分比)。相对频数直方图可以直接比较不同规模的数据集,也可作为底层概率分布的经验近似。两者的形状相同,只是 y 轴刻度不同。