標準誤計算機 - 由原始資料或彙總計算 SE

可依原始資料或彙總統計計算平均數的標準誤(SE)。立即取得 SE、信賴區間與所有關鍵描述統計。

選擇「原始資料」模式並輸入數字,或切換到「彙總統計」並提供平均數、標準差與樣本數。選擇信賴水準即可同時查看區間與 SE。

標準誤計算機 - 由原始資料或彙總計算 SE
可依原始資料或彙總統計計算平均數的標準誤(SE)。立即取得 SE、信賴區間與所有關鍵描述統計。

關於標準誤計算機

平均數的標準誤(SE 或 SEM)是樣本平均數抽樣分布的標準差。簡單來說,它告訴你如果重複抽樣,樣本平均數大約會離真實母體平均數多遠。SE 越小,表示樣本平均數對母體平均數的估計越精確;SE 越大,表示不確定性越高。 公式為 SE = s / √n,其中 s 是樣本標準差,n 是觀測值數量。在原始資料模式下,計算機會先依貝塞爾修正(分母使用 n−1)計算樣本標準差,再除以 √n。在彙總統計模式下,你直接提供平均數、標準差與 n,這在你已經拿到彙總資料——例如論文中的統計結果——但無法取得原始觀測值時特別有用。 本計算機也會依你選擇的信賴水準(90%、95% 或 99%)計算平均數的信賴區間。區間公式為 x̄ ± z × SE,其中 z 是常態分布的臨界值(90% 為 1.645,95% 為 1.96,99% 為 2.576)。這類基於 z 的區間適合大樣本(n ≥ 30)或已知母體近似常態分布的情況。對於來自非常態母體的小樣本,使用 t 分布(自由度為 n−1)的區間會更精確;實務上,只要 n ≥ 30,z 與 t 的差異通常很小。 SE 幾乎存在於定量研究的每個領域。在醫學上,臨床論文常報告平均數及其 SE 或信賴區間,讓讀者判斷治療組之間的差異是否具臨床意義。在製造業中,製程能力評估會使用 SE 來判斷樣本平均數是否可靠地落在規格界限內。在社會科學調查中,報告平均數的誤差範圍直接由 SE 決定。在金融風險分析中,SE 用於估計平均報酬及其他統計量的不確定性。在機器學習中,SE 是 bootstrap 信賴區間的基礎,用來比較模型效能指標。 理解何時報告 SE、何時報告標準差(SD)也很重要。SD 描述的是個別測量值的分散程度;在母體真實變異固定的前提下,收集更多資料並不會讓 SD 變小。SE 描述的是平均數估計的精確度,它會隨著資料增加而下降,因為 SE = SD / √n。當你的目標是傳達個體差異——例如研究中病患年齡的範圍——應報告 SD。當你的目標是傳達平均數估計的精確程度——例如平均降血壓效果的可靠性——應報告 SE 或其導出的信賴區間。

標準誤示例

以下四個示例展示兩種輸入模式與常見應用情境。

輸入SE情境
原始資料:85, 92, 88, 78, 90SE ≈ 2.4413學生考試成績(n=5)。平均數 = 86.6,SD ≈ 5.46。SE 顯示平均數的精確度約為 ±2.4 分。
原始資料:22, 25, 21, 24, 23, 26, 22SE ≈ 0.6801一週每日最高氣溫(℃)(n=7)。較小的 SE 反映天氣相當穩定。
彙總:Mean=500, SD=5, n=100SE = 0.5000工廠生產的零件重量(n=100)。雖然 SD 為 5g,但較大的 n 仍使 SE 遠低於 1g。
彙總:Mean=10, SD=3.5, n=49SE = 0.5000臨床試驗中的血壓下降值(n=49)。95% CI ≈ [9.02, 10.98] mmHg。

如何使用標準誤計算機

  1. 如果你有個別觀測值,選擇「原始資料」;如果你已知道平均數、SD 與樣本數,則選擇「彙總統計」。
  2. 輸入資料——原始資料為逗號分隔清單;彙總統計則輸入三個數值(平均數、SD、n)。
  3. 選擇信賴水準(90%、95% 或 99%),以控制信賴區間的寬度。
  4. 點擊「計算」。結果面板會顯示樣本數、平均數、SD、SE 與信賴區間。
  5. 點擊「重設」可清除所有輸入;也可使用範例按鈕載入預設資料並查看輸出。

標準誤常見問題

什麼是平均數的標準誤?
平均數的標準誤(SE 或 SEM)衡量樣本平均數作為母體平均數估計時的精確程度。它等於樣本標準差除以樣本數的平方根:SE = s / √n。SE 越小,表示樣本平均數越可靠;SE 越大,表示不確定性越高。隨著樣本數增加,SE 會下降,因為更大的樣本提供了更多關於母體的資訊。
標準誤和標準差有什麼差別?
標準差(SD)衡量個別資料點圍繞樣本平均數的分散程度。標準誤(SE)衡量樣本平均數作為母體平均數估計時的精確程度。SD 不會因觀測值增多而變小,因為母體真實變異是固定的;SE 會變小,因為 SE = SD / √n。報告結果時,使用 SD 描述資料變異性,使用 SE(或信賴區間)描述估計精度。
什麼時候該用原始資料模式,什麼時候該用彙總統計模式?
當你可以取得樣本中的每個觀測值時,使用原始資料模式——輸入全部數值後,計算機會自動算出平均數、SD 與 SE。當你只有彙總資料時,例如已發表研究中提供的平均數與標準差,或當你在規劃研究並想了解不同樣本數如何影響 SE 時,使用彙總統計模式。
為什麼樣本越大,標準誤越小?
因為 SE = SD / √n,n 增加時分母變大,SE 就會變小。直觀地說,每增加一筆觀測值,都會為母體提供更多資訊,因此樣本平均數更接近真實母體平均數。樣本數加倍會使 SE 縮小為原來的 1/√2,也就是約 0.707 倍。這就是「較大研究更可靠」這一原則的量化基礎。
應該選擇什麼信賴水準?
95% 是科學研究中最常用的慣例——95% CI 的意思是,如果你重複很多次抽樣過程,產生的區間中有 95% 會包含真實母體平均數。若你希望區間更窄並接受較高的漏判風險,可選 90%。若錯誤代價很高,例如臨床試驗或安全工程,可選 99%,以更寬的區間換取更高把握。
這個計算機對小樣本準確嗎?
本計算機使用基於 z 的信賴區間(例如 95% 時用 1.96),這在大樣本(n ≥ 30)下最為準確,因為此時常態近似非常好。對於較小樣本,正確的乘數應來自 t 分布(自由度為 n−1)的 t 值,它通常比對應的 z 值略大。對於 n ≥ 30,兩者差異很小(例如 95% 且 n=30 時,t ≈ 2.042,而 z = 1.96);但當 n < 10 時,差異就會變得明顯。對於非常小的樣本,建議使用專門的 t 區間計算機。