Fisherの正確検定計算機 - 2x2分割表

2×2分割表にFisherの正確検定を使って、片側・両側p値とオッズ比を計算します。小標本に最適です。

2×2表(群 × 結果)の4つのセル数を入力し、「計算」をクリックして正確なp値とオッズ比を取得してください。

Fisherの正確検定
2×2分割表の統計的有意性を分析
結果1結果2
グループ1
グループ2

Fisherの正確検定について

Fisherの正確検定は、2×2分割表を分析するための統計的有意性検定で、1922年に Ronald A. Fisher 卿によって開発されました。この検定は、治療群と患者転帰のような2つのカテゴリ変数の間に非偶然的な関連があるかどうかを判定します。期待セル数が小さい場合に精度が落ちる近似手法であるカイ二乗検定とは異なり、Fisherの正確検定は超幾何分布を用いて観測データ(およびそれより極端な配置すべて)の正確な確率を計算します。 この検定では、周辺合計(行合計と列合計)が固定された2×2表にデータを配置します。これらの周辺が与えられたとき、帰無仮説「関連なし」の下で観測配置の確率を計算します。セル [a, b; c, d] を持つ特定の表の確率は、超幾何公式 P = C(a+b, a) × C(c+d, c) / C(n, a+c) で与えられます。ここで n = a+b+c+d です。p値は、観測表と同等以上に極端なすべての表の確率を合計して求めます。 片側p値では、「極端」とは観測された方向と同じ方向に関連がある表を意味します。両側p値では——多くの研究課題に適しています——観測表と同じかそれより小さい確率を持つ表を両方の尾で合計します。そのため、両側p値はより保守的で、論文でもより広く使われています。 オッズ比は関連の強さを定量化します:OR = (a × d) / (b × c)。オッズ比が1なら関連なし、1より大きければグループ1の結果1がグループ2より起こりやすいことを示し、1より小さければ逆です。オッズ比は症例対照研究、臨床試験、遺伝関連研究で重要な指標です。 2×2表のどのセルでも期待度数が5未満ならFisherの正確検定が適切であり、これはカイ二乗近似が信頼できなくなる閾値です。代表的な用途には、2群間の治療成功率を比較する臨床試験、対立遺伝子と疾患の関連を調べる遺伝疫学研究、2つの教育法の合格/不合格率を比較する教育研究、2つの広告バリアントのコンバージョン率を比較するマーケティング分析などがあります。この検定はサンプルサイズに依存せず正確な結果を与えるため、これらの分野の小標本解析のゴールドスタンダードです。

Fisherの正確検定 — 例

2×2分割表の作成方法と正確なp値の解釈を示す、3つの実例です。

表 [a, b; c, d]両側 p 値文脈
a=9, b=1, c=2, d=8 (n=20)p = 0.0350(有意)新薬試験:治療を受けた10人中9人が改善し、プラセボ群10人中2人が改善しました。治療と改善の関連は統計的に有意です。
a=7, b=3, c=1, d=12 (n=23)p = 0.0189(有意)遺伝学:遺伝子変異保有者10人中7人が疾患を持ち、変異なし13人中1人が疾患を持ちました。この遺伝子は疾患と有意に関連しています。
a=10, b=2, c=5, d=8 (n=25)p = 0.0840(0.05では有意でない)教授法:方法Aでは12人中10人が合格し、方法Bでは13人中5人が合格しました。この差は5%水準で有意ではありません。
a=4, b=100, c=0, d=110 (n=214)p = 0.0563(境界的)広告A/Bテスト:各広告の表示回数は約110回で、広告Aは4件のコンバージョン、広告Bは0件でした。結果は境界的であり、より大きなサンプルでの追試が必要です。

Fisherの正確検定計算機の使い方

  1. データを2×2分割表に整理します。行は2つのグループ(グループ1とグループ2)、列は2つの結果(結果1と結果2)です。
  2. 各セルの数を入力します:セルA(グループ1、結果1)、セルB(グループ1、結果2)、セルC(グループ2、結果1)、セルD(グループ2、結果2)。すべて0以上の整数である必要があります。
  3. 「計算」をクリックします。計算機は同じ周辺合計を持つすべての可能な2×2表を列挙し、超幾何確率を合計して正確な片側・両側p値を求めます。
  4. ほとんどの研究課題では両側p値を見ます。p < 0.05 なら、2つのグループと2つの結果の関連は統計的に有意です。
  5. オッズ比を解釈します:1より大きい値はグループ1で結果1が起こりやすいことを示し、1より小さい値は起こりにくいことを示します。表の下の例ボタンで、実際の場面での使い方を確認できます。

Fisherの正確検定 — FAQ

カイ二乗検定ではなく Fisher の正確検定を使うのはいつですか?
2×2表のいずれかの期待セル数が5未満のとき、または全体のサンプルサイズが小さいとき(n < 20 がよく使われる目安)に Fisher の正確検定を使います。カイ二乗検定は近似に依存するため、小さい度数では破綻し、信頼できないp値になります。Fisher検定は常に正確なので、どのサンプルサイズにも安全に使えます。
Fisher検定の両側 p 値とは何ですか?
両側p値は、帰無仮説「関連なし」が真であると仮定したとき、どちらの方向でも現在の表と同じかそれ以上に極端な表が観測される確率です。ここでの「極端」とは、超幾何確率が観測表と同じかそれより小さいことを意味します。慣例的に p 値 < 0.05 なら統計的に有意とされます。
オッズ比とは何で、どう解釈しますか?
オッズ比(OR)は (a × d) / (b × c) です。OR が1なら、両群で結果1の起こりやすさは同じで、関連はありません。OR > 1 ならグループ1で結果1がグループ2より起こりやすく、OR < 1 なら起こりにくいことを意味します。たとえば OR = 9 は、グループ1での結果1のオッズがグループ2の9倍であることを示し、強い正の関連を表します。
片側 p 値と両側 p 値の違いは何ですか?
片側p値は、特定の方向の関連のみを検定します(たとえばグループ1の結果1の発生率がグループ2より高いか)。両側p値は、方向を問わずあらゆる関連を検定します。データを見る前に方向性の仮説を持っていなかったなら、両側p値が適切で、より保守的です。
周辺合計とは何で、なぜ固定する必要がありますか?
周辺合計とは、表の行合計(a+b と c+d)と列合計(a+c と b+d)です。Fisher検定はこれらの合計が固定されていると条件づけることで、正確な超幾何分布を導きます。実際には、周辺は研究デザインによって固定されます(たとえば事前に決めた群サイズや総イベント数など)。
Fisher の正確検定は 2×2 より大きい表にも使えますか?
古典的なFisherの正確検定は2×2表に定義されています。より大きな r×c 分割表への一般化もありますが(多次元超幾何分布を使用)、計算負荷が高いです。期待度数が小さい大きな表では、2×2部分表に対して正確検定を使うか、統計ソフトでモンテカルロシミュレーションベースの正確検定を使います。