相对频率计算器 - 频率分布
输入任意数值数据集,即可获得每个数值的频数、相对频率和累计频率,并按顺序整理好。
在数据字段中输入或粘贴用逗号分隔的数字,然后点击计算,查看完整的频率分布表。
相对频率计算器 - 频率分布
输入任意数值数据集,即可获得每个数值的频数、相对频率和累计频率,并按顺序整理好。
关于相对频率计算器
频数是统计学中最基础的概念之一:它只是统计数据集中每个数值出现的次数。相对频率更进一步,把每个次数表示为观测总数中的比例,将原始计数转换为分数或百分比,因此无论数据集大小如何都具有可比意义。单独看频数 6 很难解释;相对频率 30% 会立刻告诉你,近三分之一的观测值取了这个数值。
计算方法很直接。对数据集中的每个不同数值,统计它出现的次数——这就是绝对频数。然后用该次数除以数据点总数。乘以 100 可表示为百分比。例如,在 20 次掷骰数据中,数值 3 出现 4 次,则频数为 4,相对频率为 4/20 = 0.20,即 20%。所有不同数值的相对频率之和始终为 1(或 100%),这是一个有用的合理性检查。
累计频数是在按序排列的数值中逐步累加频数得到的。数值 v 处的累计频数,是小于或等于 v 的观测值总数。类似地,数值 v 处的累计相对频率(也称经验 CDF)是观测值 ≤ v 的比例。数据集中最大值处的累计相对频率始终恰好为 1.0(100%)。
在教育和评估中,相对频率表用于描述考试分数、成绩或调查回答的分布。面对 30 名学生,教师可以立即看到各分数段所占比例,以及分布大致是对称、左偏还是右偏。在市场研究中,相对频率能以高管和客户容易理解的形式汇总客户满意度评分、产品偏好和人口统计类别。
在质量控制和制造业中,频率分布是统计过程控制(SPC)的基础。工程师通过绘制缺陷数、尺寸或过程测量值随时间变化的相对频率,可以在产品质量受影响前发现漂移、异常波动或系统性变化。帕累托图——按频数排序的条形图——是识别少数主要缺陷类型的标准工具,其依据是常见的原则:20% 的原因往往解释 80% 的缺陷。
在概率论中,大数定律指出,随着随机试验次数增加,观测到的相对频率会收敛到理论概率。这个联系使相对频率表成为实验数据与理论概率分布之间的经验桥梁。对于 10 次抛硬币的小数据集,正面的相对频率可能远离 0.5;而抛 10,000 次时,它会非常接近。相对频率计算器可让你直接用任意数据集探索这种收敛。
一个实用提示:计算器会先按数值升序排序,再计算频数。如果你的数据集包含分类标签而不是数字,需要先将其编码为数字(例如把调查回答 Never/Sometimes/Always 编码为 1/2/3)再输入。
相对频率示例
通过掷骰、学生分数和调查数据的示例,展示频率分布输出的样子。
| 数据集 | 示例输出 | 说明 |
|---|---|---|
| 1, 6, 2, 4, 3, 5, 2, 6, 4, 1(10 次掷骰) | 每个数值 1–6 都出现;相对频率 = 次数/10 | 模拟 10 次掷骰。接近 1/6 ≈ 16.7% 的值说明骰子大致公平,但小样本会有波动。 |
| 8, 7, 9, 8, 10, 7, 5, 8, 9, 7, 8, 6, 10, 8, 7(15 个分数) | 分数 8:频数=5,相对频率=33.3%;分数 7:频数=4,相对频率=26.7% | 满分 10 分的学生考试成绩。最常见的分数是 8(占学生 33%)——教师可以看出班级整体表现良好。 |
| 5, 4, 5, 3, 2, 4, 5, 1, 3, 5, 4, 4, 2, 5, 4(15 份调查回答) | 回答 5:频数=5,相对频率=33.3%;回答 4:频数=5,相对频率=33.3% | 李克特量表调查(1=从不,5=总是)。三分之二的回答为 4 或 5,显示出强烈的正向态度。 |
| 0, 1, 0, 2, 0, 1, 1, 0, 3, 0, 1, 0, 1, 2, 0(15 批次缺陷数) | 0 个缺陷:频数=7,相对频率=46.7%;1 个缺陷:频数=5,相对频率=33.3% | 每批次的制造缺陷数。近一半批次无缺陷;只有 1 个批次有 3 个缺陷——整体缺陷率相当低。 |
如何使用相对频率计算器
- 在文本区域中以逗号分隔的数字列表输入数据集(例如 1, 2, 2, 3, 3, 3)。逗号两侧的空格会被忽略。
- 点击计算。工具会统计每个不同数值的出现次数,按升序排序,并生成频率分布表。
- 查看“频数”列了解原始计数,查看“相对频率 (%)”列了解比例,查看累计列了解分布如何逐步累积。
- 检查相对频率之和是否为 100%——如果不是,请确认数据格式正确且没有多余文本。
- 使用示例按钮加载预设数据集,在输入自己的数据之前先了解输出效果。
相对频率常见问题
频数和相对频率有什么区别?
频数是某个数值在数据集中出现次数的原始计数。相对频率是该计数除以观测总数,得到 0 到 1(或 0% 到 100%)之间的比例。比较不同规模的数据集时,相对频率更有用,因为它把计数标准化到共同尺度。
数据值必须是整数吗?
不必。计算器接受任何数值,包括小数。但请注意,如果数据包含许多唯一的小数值(例如连续测量值),生成的频率表会有很多行,且每行频数可能都是 1。对于连续数据,通常先将数值分组为组距区间,再使用分组频率分布会更有信息量。
如何用相对频率估计概率?
实验中某一结果的相对频率是其概率的经验估计。如果你掷骰 100 次,数字 4 出现 18 次,则相对频率为 18%——这是掷出 4 的真实概率(理论上为 16.7%)的估计。随着试验次数增加,根据大数定律,相对频率会收敛到真实概率。
累计相对频率告诉我什么?
数值 v 处的累计相对频率,是小于或等于 v 的观测值所占比例。它是数据的经验累积分布函数(CDF)。例如,如果分数 7 处的累计相对频率为 40%,表示 40% 的学生得分为 7 分或更低。这有助于寻找中位数、百分位排名,以及将观测分布与理论分布比较。
为什么我的相对频率之和不完全等于 100%?
在求和前把每个相对频率四舍五入到固定小数位,会引入小的差异。计算器在每个单元格中显示舍入后的值,但内部使用全精度值。如果报告需要精确的 100% 总和,应先对全精度值求和,再进行舍入,并用剩余的舍入误差调整最后一行。
这个计算器可以用于分类(非数值)数据吗?
计算器要求输入数值。若要用于分类数据——如颜色、成绩等级(A/B/C)或是/否回答——请为每个类别分配一个数字代码(例如 1 = 红色,2 = 蓝色,3 = 绿色)并输入编码值。输出会正确显示每个数字代码的频数和相对频率,你可以在报告中再改回类别标签。