配對樣本 t 檢定計算器 - 前後資料
執行配對樣本 t 檢定,比較兩組相關資料——前後測量、配對樣本——並取得 t 統計量、p 值與信賴區間。
輸入兩組等長的逗號分隔資料,設定顯著性水準與檢定類型,即可立即取得完整的配對 t 檢定結果。
配對樣本 t 檢定計算器 - 前後資料
執行配對樣本 t 檢定,比較兩組相關資料——前後測量、配對樣本——並取得 t 統計量、p 值與信賴區間。
關於配對樣本 t 檢定計算器
配對樣本 t 檢定(也稱為依賴樣本 t 檢定或配對 t 檢定)是一種參數統計程序,用來判斷兩組相關量測之間的平均差是否顯著不同於 0(或其他假設值)。之所以稱為「配對」,是因為第 1 組中的每個觀測值都對應到第 2 組中的恰好一個觀測值——兩次量測來自同一位受試者、配對的參與者,或同一地點在兩個不同時間點的量測。
最常見的應用是前後比較研究設計:研究者在介入前測量某個特徵(血壓、測驗分數、體重、銷售數字),然後在介入後再次測量。由於同一批個體被量測兩次,兩組並非獨立,而是相關的。如果忽略這種相關性而使用獨立樣本 t 檢定,就會不正確;它會因為沒有考慮到個體間的自然變異,而在處理差值時消除了這些變異,進而低估比較的精確度。
配對 t 檢定的計算關鍵在於把問題化簡為單一樣本問題。對於每一對 i,計算差值 d_i = 第 1 組_i − 第 2 組_i。接著配對 t 檢定要問的是:這些差值的平均數(d̄)是否顯著不同於 0?這樣就把雙樣本問題轉換成對差值進行的單樣本 t 檢定。檢定統計量為 t = (d̄ − μ₀) / (s_d / √n),其中 μ₀ 是假設的平均差(通常為 0)、s_d 是差值的樣本標準差,而 n 是配對數。在虛無假設下,該統計量服從自由度 df = n − 1 的 Student t 分配。
這個 t 統計量所對應的 p 值,告訴你如果母體真實平均差為 μ₀,觀察到像 d̄ 這樣大(或更大)的平均差有多大的機率。若 p 值低於你選定的顯著性水準 α,就拒絕虛無假設,並得出兩組配對量測之間存在統計顯著平均差的結論。d̄ 的信賴區間提供了真實平均差可能落入的合理範圍,通常比單獨看 p 值更有資訊量。
為了使配對 t 檢定有效,差值 d_i 必須近似服從常態分配。這個假設可透過查看差值的直方圖或常態 Q-Q 圖來檢查。當 n ≥ 30 時,即使個別差值並非完全常態,中央極限定理也會使這個假設較不敏感。對於樣本較小且差值明顯不常態的情況,Wilcoxon 符號等級檢定是對應的非參數替代方法。
常見應用包括醫療療效試驗(用藥前後)、教育研究(前測與後測)、營養與健身研究(基線與追蹤測量)以及商業分析(廣告活動前後的銷售額)。在每一種情況下,關鍵要求都是每一對數值必須來自同一位個人、實體或配對單位,而不是來自兩個獨立群體。
計算範例
三個前後比較研究情境,使用接近真實的資料來說明配對 t 檢定輸出。
| 研究設計 | t 統計量 / p 值 | 結論 |
|---|---|---|
| 治療前血壓:140,135,150,155,130,142,138,147,152,133 / 治療後:132,130,145,148,125,135,130,140,145,128(雙尾,α=0.05,n=10) | t ≈ 16.00, df = 9, p < 0.001 | 高度顯著。該藥物使 10 名病患的收縮壓平均降低了 6.4 mmHg。 |
| 測驗分數前:75,80,82,70,88,65,90,78 / 後:85,85,88,78,92,75,95,85(雙尾,α=0.05,n=8) | t ≈ −8.47, df = 7, p < 0.001 | 顯著進步。學生在課後輔導方案後平均高出 6.9 分。 |
| 每週銷售額前:500,550,480,600,520,530 / 後:540,580,500,650,550,560(雙尾,α=0.05,n=6) | t ≈ −7.91, df = 5, p < 0.001 | 廣告活動顯著提升了每週銷售額,每家門市平均增加 33.3 個單位。 |
如何使用配對樣本 t 檢定計算器
- 在第一個欄位輸入第 1 組資料(例如「前」測值),並以逗號分隔每個數字。
- 在第二個欄位輸入第 2 組資料(例如「後」測值)。兩組必須有相同數量的數值;第 1 組中的第一個數值會與第 2 組中的第一個數值配對,依此類推。
- 設定顯著性水準 α(0.01、0.05 或 0.10)與假設平均差 μ₀(通常為 0)。選擇檢定類型(雙尾、右尾或左尾)。
- 點擊「計算」即可查看 t 統計量、自由度、p 值、平均差值、差值標準差,以及 95% 信賴區間。
- 將 p 值與 α 比較。如果 p ≤ α,則拒絕 H₀,並得出存在統計顯著平均差的結論;如果 p > α,則未能拒絕 H₀。
常見問題
什麼時候該使用配對 t 檢定,而不是獨立樣本 t 檢定?
當一組中的每個觀測值都自然地與另一組中的恰好一個觀測值配對或連結時,就應使用配對 t 檢定——例如同一個人在治療前後被量測,或一對手足分別接受兩種不同飲食。如果兩組彼此獨立(不同且無關的個體,沒有配對),則應改用獨立樣本 t 檢定。
假設平均差 μ₀ 是什麼?
μ₀ 是你在虛無假設下認為真實平均差等於的值。對大多數應用——檢驗某項介入是否有任何效果——μ₀ = 0。對於更具體的假設,例如檢驗某藥物是否至少降低 10 mmHg 血壓,則應設定 μ₀ = 10。
如果我的差值不服從常態分配怎麼辦?
配對 t 檢定假設差值近似服從常態分配。當 n ≥ 30 對時,中央極限定理會讓這個假設較不重要。對於樣本較小且差值明顯不常態的情況(可檢查直方圖),Wilcoxon 符號等級檢定是穩健的非參數替代方案,因為它不假設常態性。
如何解讀信賴區間?
95% 信賴區間給出真實平均差的合理取值範圍。如果區間不包含 0,則結果在 α = 0.05 下顯著。這個區間比單看 p 值更有資訊,因為它同時呈現效應的大小與方向。例如,(2.3, 9.8) 這樣的區間表示結果顯著,且效應介於小到中等偏大之間。
我可以做單尾配對 t 檢定嗎?
可以。如果你預測第 1 組 > 第 2 組(正平均差),請選擇「右尾檢定」;如果你預測第 1 組 < 第 2 組(負平均差),請選擇「左尾檢定」。單尾檢定更有檢定力,但只有在收集資料之前就明確指定效應方向時才有效。只因為雙尾結果接近臨界值就改用單尾檢定,屬於 p-hacking。
顯著結果到底代表什麼?
顯著結果(p ≤ α)表示:如果虛無假設為真,觀察到目前這樣大的平均差,不太可能只是偶然發生的。但這並不能證明虛無假設為假,也不能保證效應很大或具有臨床重要性。應始終報告平均差 d̄、其信賴區間以及效果量(例如 Cohen's d = d̄ / s_d),讓讀者判斷實際意義。