Cohen's d效應量計算器

快速計算 Cohen's d,量化兩組平均數的標準化差異——立即取得合併標準差、效應量與解釋標籤。

輸入每組的平均數、標準差和樣本數,然後點擊「計算」即可查看 Cohen's d 與其效應量解讀。

Cohen's d效應量計算器
快速計算 Cohen's d,量化兩組平均數的標準化差異——立即取得合併標準差、效應量與解釋標籤。

第 1 組資料

第 2 組資料

關於 Cohen's d 計算器

Cohen's d 是比較兩個獨立組平均數時最常使用的效應量指標。它由統計學家 Jacob Cohen 在 1969 年具有里程碑意義的著作《Statistical Power Analysis for the Behavioral Sciences》中提出,並以合併標準差來表示兩個平均數之間的差異。這個結果是無量綱數,不論測量的是考試分數、反應時間、血壓還是每位使用者收入,都能放在同一個尺度上比較。 公式很直接:d = (M₁ − M₂) / s_pooled,其中 s_pooled 是兩組樣本變異數加權平均後的平方根。這個合併標準差考慮了兩組樣本數可能不同的事實。d 的正負號表示方向:正值代表第 1 組平均數較高,負值代表第 2 組較高。 Jacob Cohen 提出的慣例基準後來成為社會科學與生物醫學領域的標準。絕對值小於 0.2 的 d 通常被視為可忽略——兩組幾乎相同,資料中幾乎看不出實際差異。0.2 到 0.5 之間屬於小效應,但仍然真實存在;大致相當於比較 15 歲與 16 歲男孩身高時看到的重疊程度。0.5 到 0.8 之間屬於中等效應,類似 Cohen 原始分析中書記與半技術工人平均 IQ 差異的量級。大於 0.8 則屬於大效應,通常對應肉眼就能觀察到的差異,例如 13 歲與 18 歲男孩身高之間的差距。 這些基準應視為經驗法則,而不是硬性規定。在某些領域,微小的效應量也可能有巨大的實務意義。舉例來說,一種能讓百萬人規模族群的死亡率即使只下降一點點的藥物,也會帶來非常大的公共衛生效益。相反地,一份設計不佳的問卷即使得到很大的效應量,也未必代表現實世界中有意義的差異。解讀 d 時,務必同時考量信賴區間、樣本數與領域知識。 Cohen's d 也與其他效應量指標密切相關。Hedges' g 使用對合併標準差進行偏差修正的版本,較適合小樣本(每組 n < 20)。Glass's Δ 只用控制組的標準差作為分母,當兩組預期有不同變異數時特別有用。對於更複雜的設計——相關、變異數分析、迴歸——對應的效應量分別是 Pearson's r、η²(eta-squared)與 partial η²。 在實務上,Cohen's d 最常出現在功效分析、Meta 分析與研究報告中。在功效分析裡,知道預期效應量可以幫助你計算在指定檢定力(power)下所需的樣本數。在 Meta 分析中,來自多項研究的 d 值可以加權平均,得到真實效應的合併估計。在臨床研究中,許多期刊要求除了 p 值之外也要報告 d,因為結果即使達到統計顯著(p < 0.05),在樣本很大時效應量也可能非常小。

Cohen's d 範例

來自教育、醫學、心理學與行銷的四個情境,示範如何解讀效應量。

各組(M, SD, n)Cohen's d解讀
G1: M=85, SD=10, n=30 vs G2: M=80, SD=9, n=30d ≈ 0.52中等效應。新的教學方法帶來的測驗分數明顯高於對照組。
G1: M=120, SD=15, n=50 vs G2: M=130, SD=16, n=50d ≈ −0.65中等效應(負向)。藥物組的血壓低於安慰劑組——這是有利的臨床結果。
G1: M=450, SD=50, n=25 vs G2: M=500, SD=55, n=25d ≈ −0.95大效應。與未攝取咖啡因的組別相比,咖啡因顯著縮短了反應時間。
G1: M=75.50, SD=20, n=100 vs G2: M=70.25, SD=18, n=100d ≈ 0.28小效應。版面 A 讓平均購買金額略為提升——統計上可偵測,但實際影響有限。

如何使用 Cohen's d 計算器

  1. 在左側面板輸入第 1 組的平均數 (M)、標準差 (s) 和樣本數 (n)。
  2. 在右側面板輸入第 2 組相同的三個數值。樣本數至少為 2。
  3. 點擊「計算」。計算器會顯示合併標準差、Cohen's d 與解釋標籤(可忽略 / 小 / 中等 / 大)。
  4. 使用範例按鈕可載入教育、醫學研究與心理學中的預設情境。
  5. 點擊「重設」可清除所有欄位並開始新的計算。

Cohen's d 常見問題

什麼樣的 Cohen's d 算好?
Cohen 的常用基準是 d = 0.2(小)、0.5(中等)與 0.8(大)。但「好不好」取決於情境。在認知心理學中,d = 0.3 的效果常被視為有意義;在醫學中,即使是很小的 d,只要來自救命介入,也可能非常重要。解讀 d 時,應結合該領域常見的效應量與研究結果的實際後果。
什麼是合併標準差?
合併標準差把兩組的變異數合併為單一的組內離散程度估計,並依各組自由度(n − 1)加權。它是 Cohen's d 公式中的分母。使用合併標準差而不是只用其中一組的標準差,可以避免在兩組樣本數不同或變異數略有差異時扭曲效應量。
什麼時候該用 Hedges' g,而不是 Cohen's d?
Hedges' g 會對 Cohen's d 做小樣本偏差修正。對於每組 n > 20 的情況,差異通常可忽略,但在較小樣本中可能很重要。如果任一組少於 20 個觀測值,通常建議報告 Hedges' g。修正因子約為 (1 − 3 / (4(n₁+n₂) − 9)),你可以將它乘到本計算器得到的 Cohen's d 上。
Cohen's d 是否假設變異數相等?
標準的合併標準差公式隱含假設兩個母體變異數大致相等(變異數同質性)。如果變異數差異很大,可以考慮使用 Glass's Δ,只用控制組的標準差作為分母;或者針對每個比較分別報告效應量。Levene 檢定或簡單比較兩個標準差,都可以幫助你判斷此假設是否合理。
Cohen's d 可以是負的嗎?
可以。負的 d 只是表示第 2 組平均數高於第 1 組。符號反映的是差異方向,不是大小。在許多研究設計中,符號其實是任意的——取決於你如何定義第 1 組。解讀效應量時,d 的絕對值才是關鍵,而符號告訴你哪一組得分較高。
效應量和統計顯著性有什麼關係?
統計顯著性(p 值)告訴你某個效應是否不太可能由隨機因素造成。效應量(Cohen's d)告訴你這個效應有多大。樣本極大時,即使效應很小,也可能得到高度顯著的結果;反過來,樣本很小時,大效應也可能達不到顯著性。同時報告 p 值與 Cohen's d,才能完整呈現結果的強度與可靠性。