Yates連続性補正カイ二乗計算機

2×2分割表のYates補正カイ二乗統計量を計算します。期待度数が小さい場合の第I種過誤を抑えます。

2×2分割表の4つのセルの数(a、b、c、d)を入力すると、Yates補正済みのχ²値とp値を計算します。

Yates連続性補正カイ二乗計算機
2×2分割表のYates補正カイ二乗統計量を計算します。期待度数が小さい場合の第I種過誤を抑えます。

2×2分割表の数を入力してください:行はグループA、列は結果1/2です。

Yatesの連続性補正について

Yatesの連続性補正は、2×2分割表に対して用いるカイ二乗(χ²)検定の調整です。カイ二乗分布は連続ですが、分割表の観測度数は離散的なカウントです。この不一致により、カイ二乗近似は検定統計量を過大評価しやすく、p値が小さくなりすぎ、第I種過誤のリスクが高まります。特に、標本サイズや期待度数が小さい場合に顕著です。 Frank Yatesは1934年にこの補正を提案しました。考え方は単純で、観測度数と期待度数の差の絶対値から0.5を引いてから二乗します。補正後の式は χ² = Σ (|O − E| − 0.5)² / E で、4つのセルにわたって合計します。この小さな調整によりカイ二乗値は小さくなり、より保守的(大きめ)のp値が得られ、観測された結果やそれ以上に極端な結果の真の確率をよりよく反映します。 この補正は、期待度数が10未満のとき、特に5未満のときに重要です。そのような条件では標準カイ二乗検定は信頼性が低いことが知られており、Yates補正がそれを補います。標本が大きく、すべての期待度数が10を超える場合は、補正の影響はごく小さく、標準カイ二乗検定で十分です。 この計算機を使うには、データを2×2分割表として整理します。2つの行は2つの群(たとえば治療群と対照群)、2つの列は2つの結果(たとえば成功と失敗)を表します。セルaはグループAで結果1の人数、bはグループAで結果2の人数、cはグループBで結果1の人数、dはグループBで結果2の人数です。 2×2表の自由度は常に1です。p値は自由度1のカイ二乗分布から計算されます。慣例的に、p値が0.05未満であれば、群の所属と結果の間に統計的に有意な関連があると解釈されます。 Yates補正をいつ使うべきかについては、統計学界で議論が続いています。補正が強すぎて統計的検出力を下げるという意見もあります。期待度数が非常に小さい場合、現在ではFisherの正確確率検定を好む統計学者も多く、カイ二乗近似に頼らずに正確な確率を計算できます。ただし、Yates補正は今でも多くの分野で広く教えられ受け入れられており、2×2表で素早く保守的な結果を得たいときに適した選択です。

実用例

さまざまなケースを通して、計算機の動作を確認してください。

入力(a, b, c, d)χ² / p値注記
a=3, b=22, c=11, d=14χ²≈4.86, p≈0.027ワクチン試験 — 有意。ワクチンは感染率を下げています。
a=15, b=5, c=8, d=12χ²≈3.68, p≈0.055教授法 — 境界的で、α=0.05では有意ではありません。
a=25, b=975, c=15, d=985χ²≈2.07, p≈0.151A/B広告テスト — クリック率に有意差はありません。
a=1, b=49, c=6, d=44χ²≈2.48, p≈0.115まれな副作用の研究 — セル数が少ないため、ここではYates補正が不可欠です。

使い方

  1. データを2×2表に整理します。1行目をグループA、2行目をグループB、1列目を結果1、2列目を結果2にします。
  2. 最初の入力欄にセルa(グループA、結果1)の数を、2番目の入力欄にセルb(グループA、結果2)の数を入力します。
  3. 残りの入力欄にセルc(グループB、結果1)とd(グループB、結果2)の数を入力します。すべての値は0以上の整数である必要があります。
  4. 計算をクリックすると、Yates補正済みのχ²値、自由度(常に1)、p値、および有意性の判定が表示されます。
  5. 例のボタンを使うと、あらかじめ用意されたデータを読み込み、結果の確認や一般的な使用例の確認ができます。

よくある質問

Yatesの連続性補正とは何ですか?
Yates補正は、2×2表に対する標準的なカイ二乗式への調整です。観測度数と期待度数の差の絶対値から、二乗する前に0.5を引きます。これにより検定はより保守的になり、標本サイズや期待セル数が小さい場合の偽陽性(第I種過誤)のリスクが下がります。
標準カイ二乗検定ではなく、いつYates補正を使うべきですか?
期待セル数のいずれかが10未満ならYates補正を使います。すべての期待度数が10以上なら標準カイ二乗検定で十分です。期待度数が5未満の非常に小さい標本では、その状況ではさらに信頼性の高いFisherの正確確率検定を検討してください。
セルa、b、c、dは何を表しますか?
aはグループAで結果1を経験した対象者数です。bはグループAで結果2の人数です。cはグループBで結果1の人数です。dはグループBで結果2の人数です。ワクチン研究では、A群を接種者、B群を未接種者、結果1を感染、結果2を非感染とすることがあります。
2×2表の自由度が常に1なのはなぜですか?
独立性のカイ二乗検定の自由度は(行数−1)×(列数−1)です。2×2表では(2−1)×(2−1)=1になります。つまり、周辺合計と1つのセルの値がわかれば、他のセル値はすべて決まるため、自由に動かせるパラメータは1つしかありません。
Yates補正は統計的検出力を下げますか?
はい、より保守的になるということは、帰無仮説を棄却するためにより強い証拠が必要になるということです。批判者は、Yates補正が過剰補正となり、第二種過誤(実際の効果を見逃すこと)のリスクを高めると主張します。期待度数が高い大きな標本では、この補正の影響はほとんどありません。多くの現代統計学者は、小標本の2×2解析ではFisherの正確確率検定を好みます。
この計算機は2×2より大きい表にも使えますか?
いいえ。Yates補正は2×2分割表専用です。3×2や3×3など、より大きい表には、連続性補正を付けない標準のPearsonカイ二乗検定を使ってください。より大きい表では式も自由度も異なります。