Wilcoxon符號等級檢定計算器 - 配對樣本

使用非參數Wilcoxon符號等級檢定比較兩個相關樣本或重複測量。無需假設常態分布,即可取得W統計量、Z分數與p值。

請輸入成對的前後測量值,並以半形逗號分隔。兩個樣本必須具有相同數量的數值。

Wilcoxon符號等級檢定計算器 - 配對樣本
使用非參數Wilcoxon符號等級檢定比較兩個相關樣本或重複測量。無需假設常態分布,即可取得W統計量、Z分數與p值。

關於Wilcoxon符號等級檢定

Wilcoxon符號等級檢定是一種非參數統計假設檢定,用於比較兩個相關樣本或同一組的重複測量。它是配對t檢定的非參數對應方法,適用於無法證明配對差值服從常態分布的情況。 此檢定由Frank Wilcoxon於1945年提出,在臨床試驗與行為科學中尤其有用,因為同一批受試者通常會在介入前後被測量。檢定不直接使用原始數值,而是先將配對觀測值的絕對差排序,再分別加總正差與負差對應的等級。 檢定流程如下:對每一對資料計算差值 d = (after − before)。差值為零的配對會被排除。接著將絕對差由小到大排序,若有同值則分配平均等級。正差的等級和記為 W⁺,負差的等級和記為 W⁻。檢定統計量 W 取 W⁺ 與 W⁻ 中較小者。 對於較大的樣本(通常 n ≥ 10),W 的分布可用常態分布近似。Z分數根據虛無假設下 W 的平均數與標準差計算。平均數為 n(n+1)/4,標準差為 √[n(n+1)(2n+1)/24],其中 n 為非零差值的個數。 虛無假設認為配對觀測之間的中位差為零——也就是處理沒有影響。對立假設則認為中位差不為零(雙尾),或為正/負(單尾)。本計算器回報雙尾 p 值,這是最保守的選擇。 當 p 值低於 0.05 時,通常可解讀為配對測量之間有顯著差異。在血壓研究中,這可能表示某種藥物顯著降低了收縮壓;在心理學研究中,則可能顯示治療方案顯著降低了焦慮分數。 此檢定要求觀測值必須成對——樣本1中的每個觀測都必須對應樣本2中的特定觀測(例如同一受試者的不同時間點,或配對受試者)。各配對之間必須彼此獨立,且差值應來自對稱分布,但不一定是常態分布。 與配對t檢定相比,Wilcoxon符號等級檢定對離群值與非常態分布更具韌性,但在常態性假設成立時,檢定力略低。對於小樣本、有序資料,或資料中存在極端值的情況,它通常是更建議的選擇。

實用範例

透過這些範例,了解計算器如何處理不同的配對資料集。

輸入輸出說明
治療前:140,135,150,160,130,145,155,138,148,152 — 治療後:132,130,142,151,125,137,145,130,140,148W=0, Z≈−2.80, p≈0.005血壓藥物——所有差值皆為負,顯著下降。
治療前:8,7,6,9,8,7,8,9 — 治療後:6,5,5,7,6,6,7,7W=0, Z≈−2.52, p≈0.012治療後的焦慮分數——在α = 0.05下顯著改善。
治療前:75,80,82,79,88,90,76,85,89,92,78,84 — 治療後:80,85,85,83,90,94,81,88,92,95,81,89W=0, Z≈+3.06, p≈0.002學生測驗成績——新教學方法前後提升顯著。

如何使用計算器

  1. 在樣本1欄位輸入治療前(或基線)測量值,並以逗號分隔。
  2. 在樣本2欄位輸入對應的治療後測量值。兩個樣本必須具有完全相同的數值數量。
  3. 點選「計算」即可求出差值、排序,並產生W統計量、Z分數與p值。
  4. 低於0.05的p值(以紅色顯示)表示兩種條件之間存在統計上顯著差異。
  5. 使用範例按鈕可快速載入真實資料集,並用已知結果驗證計算器。

常見問題

Wilcoxon符號等級檢定與配對t檢定有什麼差別?
兩者都用來比較配對測量,但配對t檢定假設差值服從常態分布。Wilcoxon符號等級檢定不做此假設,因此更適合小樣本、有序資料或存在明顯離群值的資料。當常態性成立時,t檢定的檢定力略高。
差值為零的配對會如何處理?
前後數值完全相同(差值 = 0)的配對會從分析中排除。用於計算檢定統計量與p值的有效樣本數 n 只計算非零差值。這是多數統計教科書建議的標準程序。
並列差值如何處理?
當多個配對具有相同的絕對差值時,這些值會取得它們原本應占等級的平均值。舉例來說,三個 |d| = 5 的配對若競爭第4、5、6等級,則每個都取第5等級。這種中位等級修正可維持Z近似的有效性。
為什麼這個計算器只回報雙尾p值?
雙尾檢定最保守,也是多數探索性研究的預設選擇。它檢驗中位差是否在任一方向上等於零。若是假設有方向性的研究(例如治療一定改善結果),可以將回報的雙尾p值除以2,得到單尾p值。
樣本量多大時Z近似才有效?
當 n ≥ 10(移除零差值後)時,W統計量的常態近似通常相當可靠。對於較小樣本,應參考Wilcoxon表中的精確臨界值。此計算器使用常態近似,因此在 n < 10 時需審慎解讀。