標準誤差計算機 - 由原始資料或彙總計算 SE

可依原始資料或彙總統計計算平均數的標準誤差(SE)。立即取得 SE、信賴區間與所有關鍵描述統計。

選擇「原始資料」模式並輸入數值,或切換到「彙總統計」並提供平均數、標準差與樣本數。選擇信賴水準即可同時查看區間與 SE。

標準誤差計算機 - 由原始資料或彙總計算 SE
可依原始資料或彙總統計計算平均數的標準誤差(SE)。立即取得 SE、信賴區間與所有關鍵描述統計。

關於標準誤差計算機

平均數的標準誤差(SE 或 SEM)是樣本平均數抽樣分配的標準差。白話來說,它告訴你,如果反覆進行抽樣,樣本平均數可能離真實母體平均數有多遠。SE 越小,代表樣本平均數作為母體平均數估計的精確度越高;SE 越大,則代表不確定性較高。 公式為 SE = s / √n,其中 s 是樣本標準差,n 是觀測值數量。在原始資料模式下,計算機會先計算樣本標準差(使用 n−1 作為分母的貝塞爾修正),再除以 √n。在彙總統計模式下,你直接提供平均數、標準差與 n;當你已有論文中的彙總資料但沒有原始觀測值時,這種方式特別實用。 本計算機也會依你選擇的信賴水準(90%、95% 或 99%)計算平均數的信賴區間。區間以 x̄ ± z × SE 建構,其中 z 是標準常態分配的臨界值(90% 為 1.645、95% 為 1.96、99% 為 2.576)。這類以 z 為基礎的區間適用於大樣本(n ≥ 30)或母體已知服從常態分配的情況。對於來自非常態母體的小樣本,使用 t 分配(n−1 自由度)的 t 區間會更精確;實務上,當 n ≥ 30 時,z 與 t 的數值幾乎相同。 SE 幾乎用於定量研究的每個領域。在醫學上,臨床論文常報告平均數及其 SE 或信賴區間,讓讀者判斷治療組之間的差異是否具有臨床意義。在製造業中,製程能力評估會用 SE 來判斷樣本平均數是否可靠地落在規格範圍內。在社會科學調查中,所報告平均數的誤差範圍直接取決於 SE。在金融風險分析中,SE 用來估計平均報酬及其他統計量的不確定性。在機器學習中,SE 是用於比較模型表現指標的自助法信賴區間基礎。 理解何時報告 SE 而不是標準差(SD)很重要。SD 描述的是個別測量值的分散程度;即使收集更多資料,它也不會縮小(假設真實母體變異固定)。SE 描述的是平均數估計的精確度,並且會隨資料增加而變小,因為 SE = SD / √n。當你的目標是傳達個體間的變異性——例如研究中病患年齡的範圍——應報告 SD。當你的目標是傳達平均數估計的精確度——例如平均降血壓效果的可靠性——應報告 SE 或其推導出的信賴區間。

標準誤差範例

四個範例同時展示兩種輸入模式與常見應用。

輸入SE情境
原始資料:85, 92, 88, 78, 90SE ≈ 2.4413學生測驗分數(n=5)。平均數 = 86.6,SD ≈ 5.46。SE 顯示平均數約有 ±2.4 分的精度。
原始資料:22, 25, 21, 24, 23, 26, 22SE ≈ 0.6801一週每日最高氣溫(°C,n=7)。狹窄的 SE 反映天氣相當一致。
彙總:平均數=500,SD=5,n=100SE = 0.5000工廠製造的零件重量(n=100)。儘管 SD 為 5g,較大的 n 仍讓 SE 遠低於 1g。
彙總:平均數=10,SD=3.5,n=49SE = 0.5000臨床試驗的血壓下降(n=49)。95% CI ≈ [9.02, 10.98] mmHg。

如何使用標準誤差計算機

  1. 如果你有個別觀測值,請選擇「原始資料」;如果你已知道平均數、SD 與樣本數,請選擇「彙總統計」。
  2. 輸入資料——原始資料輸入逗號分隔清單;彙總統計輸入三個數值(平均數、SD、n)。
  3. 選擇信賴水準(90%、95% 或 99%),以控制信賴區間的寬度。
  4. 點擊「計算」。結果面板會顯示樣本數、平均數、SD、SE 與信賴區間。
  5. 點擊「重設」清除所有輸入,或使用範例按鈕載入預設資料集並查看輸出。

標準誤差常見問題

什麼是平均數的標準誤差?
平均數標準誤差(SE 或 SEM)衡量樣本平均數作為母體平均數估計值時的精確度。它等於樣本標準差除以樣本數平方根:SE = s / √n。SE 小表示樣本平均數是可靠的估計;SE 大表示不確定性較高。隨著樣本數增加,SE 會降低,因為更大的樣本能提供更多關於母體的資訊。
標準誤差和標準差有什麼不同?
標準差(SD)衡量個別資料點圍繞樣本平均數的分散程度。標準誤差(SE)衡量樣本平均數作為母體平均數估計值時的精確度。由於真實母體變異固定,SD 不會隨觀測數增加而縮小;而 SE 會縮小,因為 SE = SD / √n。報告結果時,用 SD 描述資料變異,用 SE(或信賴區間)描述估計精確度。
什麼時候應該使用原始資料模式,什麼時候應該使用彙總統計模式?
當你能取得樣本中的個別測量值時,請使用原始資料模式——輸入所有數值,計算機就會自動計算平均數、SD 與 SE。當你已經有彙總資料時,請使用彙總統計模式,例如已發表研究中報告的平均數與標準差,或當你正在規劃研究並想探索不同樣本數如何影響 SE 時。
為什麼較大的樣本會產生較小的標準誤差?
因為 SE = SD / √n,當 n 增加時,分母變大,SE 就變小。從概念上說,每增加一筆觀測值,都會為母體提供更多資訊,因此樣本平均數能更精確地逼近真實母體平均數。樣本數加倍會使 SE 變為原來的 1/√2 ≈ 0.71。這就是「較大的研究能產生更可靠結論」這一原則的量化基礎。
我應該選擇什麼信賴水準?
95% 是科學研究中最常用的慣例——95% CI 的意思是,如果你重複抽樣很多次,所得區間中有 95% 會包含真實母體平均數。若你偏好更窄的區間並願意接受較高的漏判風險,可使用 90%。若漏掉真實值的代價很高,例如臨床試驗或安全工程,則可使用 99%,以較寬的區間換取更高的確定性。
這個計算機對小樣本準確嗎?
本計算機使用基於 z 的信賴區間(95% 時為 1.96 等),這在大樣本(n ≥ 30)且常態近似良好時最準確。對較小樣本,正確的乘數應是 t 分配中自由度為 n−1 的 t 值,它通常會比對應的 z 值略大。當 n ≥ 30 時差異很小(例如 n=30、95% 時 t≈2.042,而 z=1.96),但當 n < 10 時差異就會明顯。對於非常小的樣本,建議使用專門的 t 區間計算機。