顯著結果（p ≤ α）表示：如果虛無假設為真，觀察到目前這樣大的平均差，不太可能只是偶然發生的。但這並不能證明虛無假設為假，也不能保證效應很大或具有臨床重要性。應始終報告平均差 d̄、其信賴區間以及效果量（例如 Cohen's d = d̄ / s_d），讓讀者判斷實際意義。

Question 1

什麼時候該使用配對 t 檢定，而不是獨立樣本 t 檢定？

Accepted Answer

當一組中的每個觀測值都自然地與另一組中的恰好一個觀測值配對或連結時，就應使用配對 t 檢定——例如同一個人在治療前後被量測，或一對手足分別接受兩種不同飲食。如果兩組彼此獨立（不同且無關的個體，沒有配對），則應改用獨立樣本 t 檢定。

Question 2

假設平均差 μ₀ 是什麼？

Accepted Answer

μ₀ 是你在虛無假設下認為真實平均差等於的值。對大多數應用——檢驗某項介入是否有任何效果——μ₀ = 0。對於更具體的假設，例如檢驗某藥物是否至少降低 10 mmHg 血壓，則應設定 μ₀ = 10。

Question 3

如果我的差值不服從常態分配怎麼辦？

Accepted Answer

配對 t 檢定假設差值近似服從常態分配。當 n ≥ 30 對時，中央極限定理會讓這個假設較不重要。對於樣本較小且差值明顯不常態的情況（可檢查直方圖），Wilcoxon 符號等級檢定是穩健的非參數替代方案，因為它不假設常態性。

Question 4

如何解讀信賴區間？

Accepted Answer

95% 信賴區間給出真實平均差的合理取值範圍。如果區間不包含 0，則結果在 α = 0.05 下顯著。這個區間比單看 p 值更有資訊，因為它同時呈現效應的大小與方向。例如，(2.3, 9.8) 這樣的區間表示結果顯著，且效應介於小到中等偏大之間。

Question 5

我可以做單尾配對 t 檢定嗎？

Accepted Answer

可以。如果你預測第 1 組 > 第 2 組（正平均差），請選擇「右尾檢定」；如果你預測第 1 組 < 第 2 組（負平均差），請選擇「左尾檢定」。單尾檢定更有檢定力，但只有在收集資料之前就明確指定效應方向時才有效。只因為雙尾結果接近臨界值就改用單尾檢定，屬於 p-hacking。

Question 6

顯著結果到底代表什麼？

Accepted Answer

顯著結果（p ≤ α）表示：如果虛無假設為真，觀察到目前這樣大的平均差，不太可能只是偶然發生的。但這並不能證明虛無假設為假，也不能保證效應很大或具有臨床重要性。應始終報告平均差 d̄、其信賴區間以及效果量（例如 Cohen's d = d̄ / s_d），讓讀者判斷實際意義。

研究設計	t 統計量 / p 值	結論
治療前血壓：140,135,150,155,130,142,138,147,152,133 / 治療後：132,130,145,148,125,135,130,140,145,128（雙尾，α=0.05，n=10）	t ≈ 16.00, df = 9, p < 0.001	高度顯著。該藥物使 10 名病患的收縮壓平均降低了 6.4 mmHg。
測驗分數前：75,80,82,70,88,65,90,78 / 後：85,85,88,78,92,75,95,85（雙尾，α=0.05，n=8）	t ≈ −8.47, df = 7, p < 0.001	顯著進步。學生在課後輔導方案後平均高出 6.9 分。
每週銷售額前：500,550,480,600,520,530 / 後：540,580,500,650,550,560（雙尾，α=0.05，n=6）	t ≈ −7.91, df = 5, p < 0.001	廣告活動顯著提升了每週銷售額，每家門市平均增加 33.3 個單位。

配對樣本 t 檢定計算器 - 前後資料

關於配對樣本 t 檢定計算器