頻率分布計算器 - 建立表格

從任何資料集快速建立完整的頻率分布表,立即取得組距、頻數、相對頻數、累積頻數與關鍵摘要統計。

將數字以逗號、空格或換行分隔後貼上或輸入,選擇組數,然後按一下「計算」即可產生完整的頻率表與摘要。

頻率分布計算器
將資料依組距整理成分組區間,並計算頻數與統計量

數字之間可用逗號、空格或換行分隔。

關於頻率分布計算器

頻率分布是一種表格式摘要,用來顯示資料集中每個數值——或某個數值範圍——出現的次數。透過將原始資料整理成適量的組區間,並統計每個區間中的觀測值,頻率分布表能把雜亂的數字清單轉化為結構化的圖像,呈現資料的形狀、中心與分散程度。頻率分布是描述統計的基礎概念,也是直方圖、相對頻率多邊形與累積頻率曲線的基礎。 分組頻率分布會將資料範圍切分為固定數量、互不重疊且等寬的組區間。每個區間都有下界、上界與組中點。頻數是落入該區間的資料點數量。相對頻數是把頻數表示成總數的比例(或百分比),方便比較不同規模資料集的分布。累積頻數則是從第一組累加到目前組的頻數總和,顯示每個組界限以下共有多少資料點。 組數的選擇需要平衡:太少會把不同型態合併成一團,太多則會把資料切得太細,難以看出明顯模式。常見經驗法則是 Sturges 公式:k = 1 + 3.322 × log₁₀(n),其中 n 是資料點數。例如,20 個資料點大約建議 5 組;100 個資料點大約建議 7 組。組距通常計算為 width = (max − min) / k,再向上取整到方便使用的值,以確保所有資料點都能整齊落入區間。 由頻率分布推導出的摘要統計量,是基於分組資料的近似值,而非每個原始值。分組平均數的計算方式為 Σ(組中點 × 頻數) / n。分組標準差衡量資料圍繞分組平均數的離散程度。分組中位數則透過對包含第 n/2 個觀測值的組區間進行內插估計。當組距相對於範圍較小時,這些近似值通常與由原始資料計算出的精確值非常接近。 頻率分布廣泛應用於各種會產生數值資料的領域。教育工作者用它分析班級測驗成績,並找出可能需要額外支援的學生。企業用它分析銷售交易金額、產品評分或顧客等待時間,以找出高峰與瓶頸。醫療研究人員會分析血壓、膽固醇或 BMI 等臨床指標,以了解族群健康狀況。品管工程師則會檢查生產流程中的量測資料,以發現瑕疵或漂移。對每一種情境來說,頻率分布表都是進一步分析的起點。

頻率分布——範例

三個實用資料集,展示不同的組結構與摘要統計。

資料集結構情境
82,90,75,68,88,75,95,100,72,85,91,78,84,88,77,95,65,80,73,86 — 5 組組區間:[65,72), [72,79), [79,86) …;平均數 ≈ 82.85某班 20 名學生的測驗成績。組距 = 7。多數成績集中在 72–93 區間,略帶左尾。
150,220,180,190,250,160,200,210,170,240,195,175,215,185,230 — 6 組組區間:[150,170), [170,190), [190,210) …;平均數 ≈ 202.7每日銷售額資料。組距 = 20。分布顯示大多數日期集中在 170–230 美元區間。
35,42,38,50,45,48,36,39,47,41,43,46,40,37,44,49,38,42,45,36 — 5 組組區間:[35,38), [38,41), [41,44) …;平均數 ≈ 42.1植物高度(公分)的植物學研究資料。鐘形分布顯示生長模式大致符合常態分布。

如何使用頻率分布計算器

  1. 在「資料集」欄位中輸入數值資料。你可以用逗號、空格或換行分隔數值,計算器支援這些分隔符號的任意組合。
  2. 選擇最適合資料集的組數(區間數)。小型資料集(n < 30)可先用 5 組,較大的資料集可用 7–10 組。你也可以使用 Sturges 公式:k ≈ 1 + 3.322 × log₁₀(n)。
  3. 按一下「計算」。計算器會找出最小值與最大值,把組距計算為 (max − min) / classes 並向上取整,然後將每個資料點指派到對應區間。
  4. 閱讀頻率表。每一列都會顯示組區間、組中點、頻數、相對頻數(占總數的百分比)以及累積頻數(累計總和)。
  5. 查看表格下方的摘要統計量,了解分組平均數、中位數、標準差與組距。你也可以使用載入範例按鈕來試用預填資料集。

頻率分布計算器——常見問題

什麼是頻率分布表?
頻率分布表會把原始數值資料整理成稱為組區間(或 bins)的分組,並計算每組中有多少數值。它把無序清單轉化為結構化摘要,顯示資料點聚集的位置、分散程度,以及整體分布的形狀。
如何選擇組數?
常見方法是使用 Sturges 公式:k = 1 + 3.322 × log₁₀(n),其中 n 是樣本數。這樣 20 個資料點大約對應 5 組,100 個資料點大約對應 7 組。你也可以直接試試:先從 5 組開始,再逐步增加,直到分布呈現清楚模式且不會太雜亂。多數教科書建議使用 5–15 組。
什麼是相對頻數,為什麼有用?
相對頻數是某一組中觀測值占總觀測數的比例:相對頻數 = 該組頻數 / 總 n。它把計數轉換成百分比,方便比較不同規模的資料集。例如,在比較兩個不同規模的班級時,知道 35% 的考試成績落在 70–80 區間,比只知道人數更有參考價值。
什麼是累積頻數?
累積頻數是從第一組到目前組的頻數總和。它告訴你有多少資料點位於每組上界及以下。例如,如果第三組結束時的累積頻數是 15/20,那麼 75% 的觀測值落在前三組。累積頻數是 ogive(累積頻率曲線)的基礎。
為什麼平均數和標準差標註為「分組」?
當資料被分到各個組區間時,原始個別數值會遺失。分組平均數和標準差是用每組的組中點作為代表值計算的,因此會帶來些許近似。當組距相對於範圍較小時,這些估計非常準確,但與基於原始資料計算的統計量可能略有差異。
頻數直方圖和相對頻數直方圖有什麼差別?
頻數直方圖在 y 軸上繪製原始計數,而相對頻數直方圖則繪製比例(或百分比)。相對頻數直方圖可直接比較不同規模的資料集,也能作為底層機率分布的經驗近似。兩者形狀相同,只是 y 軸刻度不同。