Fisher的確切檢定計算器 - 2x2列聯表
使用Fisher確切檢定計算2×2列聯表的單尾與雙尾 p 值以及勝算比,適合小樣本。
輸入2×2表(群組 × 結果)的四個儲存格計數,然後點擊「計算」取得精確 p 值與勝算比。
Fisher確切檢定
分析2×2列聯表的統計顯著性
| 結果1 | 結果2 | |
|---|---|---|
| 群組1 | ||
| 群組2 |
關於 Fisher 確切檢定
Fisher確切檢定是一種用於分析2×2列聯表的統計顯著性檢定,由 Ronald A. Fisher 爵士於1922年提出。此檢定用來判斷兩個類別變數之間是否存在非隨機關聯,例如治療組與病患結局之間的關係。不同於卡方檢定,後者只是近似方法,在期望儲存格次數較小時會變得不準確,Fisher確切檢定會使用超幾何分布計算觀測資料(以及所有更極端配置)的精確機率。
此檢定將資料排列成一個邊際總數固定(列總和與欄總和固定)的2×2表。給定這些邊際,在無關聯的虛無假設下,檢定會計算觀測排列的機率。單一表格 [a, b; c, d] 的機率由超幾何公式給出:P = C(a+b, a) × C(c+d, c) / C(n, a+c),其中 n = a+b+c+d。p 值則是將所有至少與觀測表一樣極端的表格之機率加總而得。
對於單尾 p 值,「極端」是指與觀測結果方向一致的表格。對於雙尾 p 值——這適用於大多數研究問題——「極端」是指機率等於或小於觀測表的表格,並且在兩個尾端加總。因此,雙尾 p 值更保守,也更常用於正式發表的研究。
勝算比用來量化關聯強度:OR = (a × d) / (b × c)。勝算比為1表示無關聯;大於1表示群組1中的結果1比群組2更可能;小於1則表示相反。勝算比是病例對照研究、臨床試驗與遺傳關聯研究中的關鍵指標。
當2×2表中任何儲存格的期望次數低於5時,Fisher確切檢定就很適合使用,這也是卡方近似變得不可靠的門檻。常見應用包括比較兩組治療成功率的臨床試驗、檢驗等位基因是否與疾病相關的遺傳流行病學研究、比較兩種教學方法及格/不及格率的教育研究,以及比較兩種廣告版本轉換率的行銷分析。此檢定不受樣本數影響而給出精確結果,因此是這些領域中小樣本分析的黃金標準。
Fisher確切檢定 — 範例
三個真實情境,示範如何建立2×2列聯表並解讀精確 p 值。
| 表 [a, b; c, d] | 雙尾 p 值 | 情境 |
|---|---|---|
| a=9, b=1, c=2, d=8 (n=20) | p = 0.0350(顯著) | 新藥試驗:10名接受治療的病患中有9名改善,而安慰劑組10名中有2名改善。治療與改善之間的關聯具有統計顯著性。 |
| a=7, b=3, c=1, d=12 (n=23) | p = 0.0189(顯著) | 遺傳學:10名攜帶該基因變異者中有7人患病,而13名未攜帶者中只有1人患病。該基因與疾病顯著相關。 |
| a=10, b=2, c=5, d=8 (n=25) | p = 0.0840(在 0.05 水準下不顯著) | 教學方法:方法A下12名學生中有10名通過,方法B下13名學生中有5名通過。此差異在5%水準下不顯著。 |
| a=4, b=100, c=0, d=110 (n=214) | p = 0.0563(邊緣) | 廣告A/B測試:每個廣告約110次曝光中,廣告A帶來4次轉換,而廣告B為0次。結果介於臨界邊緣,值得進行更大樣本的後續研究。 |
如何使用 Fisher 確切檢定計算器
- 將資料整理成2×2列聯表:列是兩個群組(群組1與群組2),欄是兩個可能結果(結果1與結果2)。
- 輸入每個儲存格的計數:儲存格A(群組1,結果1)、儲存格B(群組1,結果2)、儲存格C(群組2,結果1)、儲存格D(群組2,結果2)。所有值都必須是非負整數。
- 點擊「計算」。計算器會枚舉所有與邊際總數相同的可能2×2表,並對超幾何機率加總,得到精確的單尾與雙尾 p 值。
- 對於大多數研究問題,請閱讀雙尾 p 值。如果 p < 0.05,則兩個群組與兩個結果之間的關聯具有統計顯著性。
- 解讀勝算比:大於1表示群組1中的結果1更可能;小於1表示其可能性較低。可使用表格下方的範例按鈕查看此檢定如何應用於真實情境。
Fisher確切檢定 — 常見問題
什麼時候應該使用 Fisher 確切檢定而不是卡方檢定?
當2×2表中任何一個儲存格的期望次數低於5,或整體樣本數較小時(n < 20 是常見經驗法則),應使用 Fisher 確切檢定。卡方檢定依賴近似,在小次數下會失效,導致 p 值不可靠。Fisher 檢定始終是精確的,因此可安全用於任何樣本數。
Fisher 檢定中的雙尾 p 值是什麼意思?
雙尾 p 值是在虛無假設「無關聯」為真時,從任一方向觀察到與目前表格一樣極端或更極端結果的機率。這裡的「極端」是指超幾何機率與觀測表一樣小或更小。依慣例,p 值 < 0.05 表示關聯具有統計顯著性。
什麼是勝算比,該怎麼解讀?
勝算比(OR)= (a × d) / (b × c)。OR 為1表示兩個群組中結果1的發生機率相同,也就是無關聯。OR > 1表示群組1中的結果1比群組2更可能;OR < 1則表示更不可能。例如,OR = 9 表示群組1中結果1的勝算是群組2的9倍,代表很強的正向關聯。
單尾 p 值與雙尾 p 值有什麼差別?
單尾 p 值檢驗某個特定方向的關聯(例如群組1中結果1的發生率高於群組2)。雙尾 p 值則檢驗任何方向的關聯。除非在看資料之前就已有明確的方向性假設,否則應選擇雙尾 p 值,它更適合也更保守。
什麼是邊際總數,為什麼必須固定?
邊際總數是表中的列和(a+b 與 c+d)以及欄和(a+c 與 b+d)。Fisher檢定以這些總數固定為條件,這是推導精確超幾何分布的基礎。在實務上,邊際通常由研究設計決定(例如預先設定的組別大小或事件總數)。
Fisher 確切檢定能用於大於 2×2 的表嗎?
經典的 Fisher 確切檢定定義於2×2表。更大的 r×c 列聯表也有延伸版本(使用多維超幾何分布),但計算成本很高。對於期望次數較小的大表,可以對2×2子表使用精確檢定,或在統計軟體中使用基於蒙地卡羅模擬的精確檢定。