離散度計算器 - 變異數、標準差與四分位距

從任何數值資料集中計算完整的離散程度指標——範圍、變異數、標準差、四分位距、變異係數與 MAD。

輸入以逗號分隔的數字並點擊「計算」,即可立即查看所有離散程度與中心趨勢統計量。

離散度計算器 - 變異數、標準差與四分位距
從任何數值資料集中計算完整的離散程度指標——範圍、變異數、標準差、四分位距、變異係數與 MAD。

關於離散度計算器

統計離散程度描述的是資料集中各個數值有多分散。中心趨勢指標——平均值、中位數與眾數——告訴你分布中心在哪裡,而離散程度指標則告訴你各個資料點偏離該中心有多遠。兩個資料集可能擁有相同的平均值,卻呈現截然不同的分布;正是離散程度指標揭示了這種差異。 範圍是最簡單的離散程度指標:最大值與最小值之差。它容易計算,也容易理解,但因為完全依賴兩個極端值,所以對離群值非常敏感,並且會忽略中間所有資訊。 變異數衡量與平均值之間平方偏差的平均值。樣本變異數會把平方偏差總和除以 (n−1)——使用貝塞爾修正,可在樣本情境下對母體變異數給出不偏估計。母體變異數則除以 n,只適用於你的資料集本身就是所關注的完整母體。標準差是變異數的平方根,單位與原始資料相同。 四分位距(IQR)衡量中間 50% 資料的跨度,計算方式為 Q3 − Q1,其中 Q1 是第 25 百分位,Q3 是第 75 百分位。由於它忽略了最低和最高 25% 的數值,IQR 對離群值更穩健,因此是偏態分布最常用的離散程度指標。 變異係數(CV)把樣本標準差表示為平均值的百分比,因此是一種無量綱指標,可用來比較不同單位或不同量級資料集的相對變異性。CV 為 10% 表示標準差相當於平均值的 10%——這是比較實驗測量精度時很有用的基準。 中位數絕對偏差(MAD)是各資料點偏離中位數的絕對值的中位數。它比四分位距更能抵抗離群值,常用於穩健統計與異常偵測。和 IQR 一樣,MAD 對極端值不敏感,能為重尾或偏態分布的資料集提供可靠的離散程度度量。

離散度計算器範例

三組真實世界資料集,說明不同的離散模式。

資料集關鍵指標解讀
85, 92, 78, 88, 76, 95, 89, 72平均值=84.375,SD≈8.19,IQR=12.25班級測驗成績。CV≈9.71% 表示相對離散程度中等。IQR 為 12.25,顯示中間 50% 的學生分數落在 12 分的區間內。
1.2, -0.5, 2.1, 0.8, -1.9, 1.5, 2.5, -0.2, 0.3, 1.7, -1.1, 2.3平均值=0.725,SD≈1.40,IQR=2.075每月股票報酬率(%)。較高的 CV(>100%)反映了相對於較小正平均報酬的顯著波動性。
502, 499, 505, 498, 501, 503, 497, 500平均值=500.625,SD≈2.67,CV≈0.53%品質管制批次中的產品重量(g)。極低的 CV 證明製造過程圍繞 500 g 目標非常穩定。

如何使用離散度計算器

  1. 將資料值輸入或貼到文字區域中,可用逗號、空格或換行分隔。
  2. 點擊「計算」。計算器會解析數字,並忽略任何非數值內容。
  3. 查看中心趨勢指標(數量、平均值、中位數),了解資料的中心位置。
  4. 檢查離散程度指標:範圍看整體跨度,標準差看相對於平均值的平均偏離,IQR 看中間 50% 的跨度。
  5. 使用變異係數比較不同資料集的相對變異性,並使用 MAD 作為更穩健、抗離群值的離散程度指標。

離散度計算器常見問題

什麼時候該用 IQR 而不是標準差?
當資料偏斜、包含離群值,或來自非正態分布時,應使用 IQR。IQR 只考慮中間 50% 的資料,不受極端值影響。標準差會把所有數值都納入計算,因此一個離群值就可能讓它明顯放大。對於沒有離群值的正態分布資料,這兩種指標都很有參考價值。
樣本變異數和母體變異數有什麼差別?
母體變異數用平方偏差總和除以 n(總數),適用於你擁有整個母體資料的情況。樣本變異數用 n−1(貝塞爾修正)作為除數,用於從樣本估計母體變異數時的偏差修正。對於大樣本,兩者差異很小;對於小樣本(n < 30),差異更明顯。
變異係數告訴我什麼?
變異係數(CV)把標準差表示為平均值的百分比,因此提供了一種與尺度無關的相對變異性度量。CV 為 5% 表示資料相對穩定;CV 為 50% 表示相對於平均值,它的變動很大。CV 特別適合比較不同單位的測量值,例如比較兩種製造流程的一致性。
中位數絕對偏差(MAD)是如何計算的?
MAD 是各資料點偏離中位數的絕對值的中位數:MAD = median(|xi − median(x)|)。它比標準差更能抵抗離群值,因為它使用的是偏差的中位數而不是平均值。常用的穩健標準差估計為 1.4826 × MAD,對於常態分布,這個值等於標準差。
為什麼平均值和中位數可能差很多?
當平均值和中位數差異很大時,表示分布存在偏斜。平均值遠大於中位數表示右偏(少數很大的值把平均值拉高)。平均值遠小於中位數表示左偏。對於偏態分布,中位數通常比平均值更適合作為中心趨勢指標,而 IQR 比標準差更適合作為離散程度指標。
這個計算器能處理非常大的資料集嗎?
它可以處理你能輸入的任何規模資料集,但非常大的輸入在解析時可能會較慢。為了最佳效能,建議使用單行逗號分隔值,或分布在多行中。計算採用數值穩定的演算法,可避免典型資料範圍內的溢位和下溢。如果你要分析數百萬個數值,R 或 Python pandas 之類的專用統計套件會更有效率。