Yates連続性補正カイ二乗計算機

2×2分割表のYates補正付きカイ二乗統計量を計算します。期待度数が小さいときの第1種過誤を抑えます。

2×2分割表の4つのセル数(a、b、c、d)を入力して、Yates補正後のχ²値とp値を求めます。

Yates連続性補正カイ二乗計算機
2×2分割表のYates補正付きカイ二乗統計量を計算します。期待度数が小さいときの第1種過誤を抑えます。

2×2分割表の度数を入力してください。A群が行、結果1/2が列です。

Yatesの連続性補正について

Yatesの連続性補正は、2×2分割表でカイ二乗(χ²)検定を行うときに用いる調整です。カイ二乗分布は連続的ですが、分割表の観測頻度は離散的なカウントです。この違いにより、カイ二乗近似は検定統計量を過大評価しやすく、p値が小さく出て、第1種過誤のリスクが高まります。特に標本サイズや期待度数が小さい場合に顕著です。 Frank Yates は1934年にこの補正を提案しました。考え方は単純で、観測頻度と期待頻度の差の絶対値から0.5を引いてから二乗します。補正後の式は χ² = Σ (|O − E| − 0.5)² / E で、4つのセルすべてについて合計します。この小さな調整により全体のカイ二乗値は下がり、より保守的(大きめ)のp値が得られます。これにより、観測結果またはそれ以上に極端な結果が本当に起こる確率を、よりよく反映できます。 期待度数が10未満、特に5未満のセルがある場合、この補正はとても重要です。そのような条件では標準のカイ二乗検定は信頼性が低いとされ、Yates補正がその不足を補います。すべての期待度数が10を超えるような大きな標本では、補正の影響は小さく、標準のカイ二乗検定で十分です。 この計算機を使うには、データを2×2分割表として整理します。2つの行は2つの समूह(たとえば治療群と対照群)、2つの列は2つの結果(たとえば成功と失敗)を表します。aはA群で結果1の人数、bはA群で結果2の人数、cはB群で結果1の人数、dはB群で結果2の人数です。 2×2表の自由度は常に1です。p値は自由度1のカイ二乗分布から計算されます。一般にp値が0.05未満なら、群と結果の間に統計学的に有意な関連があると解釈されます。 Yates補正をいつ使うべきかについては、統計学の分野で今も議論があります。過剰に補正して統計的検出力を下げるという意見もあります。期待度数が非常に小さい場合に多くの現代的な統計家が推奨する代替案はFisherの正確検定で、カイ二乗近似に頼らずに正確な確率を計算します。それでもYates補正は広く教えられ、多くの分野で受け入れられており、2×2表で手早く保守的な結果を得たいときには適切な選択です。

実用例

さまざまなシナリオを見て、計算機の動きを理解しましょう。

入力(a, b, c, d)χ² / p値備考
a=3, b=22, c=11, d=14χ²≈4.86, p≈0.027ワクチン試験 — 有意。ワクチンは感染率を下げる。
a=15, b=5, c=8, d=12χ²≈3.68, p≈0.055教授法 — 境界的だが、α=0.05では有意ではない。
a=25, b=975, c=15, d=985χ²≈2.07, p≈0.151A/B広告テスト — クリック率に有意差はない。
a=1, b=49, c=6, d=44χ²≈2.48, p≈0.115稀な副作用の研究 — セル数が少ないため、ここではYates補正が不可欠です。

使い方

  1. データを2×2表に配置します。A群を1行目、B群を2行目、結果1を1列目、結果2を2列目にします。
  2. 最初の入力欄にセルa(A群、結果1)の度数を、2つ目の入力欄にb(A群、結果2)の度数を入力します。
  3. 残りの欄にセルc(B群、結果1)とd(B群、結果2)の度数を入力します。すべての値は0以上の整数でなければなりません。
  4. [計算]をクリックすると、Yates補正後のχ²値、自由度(常に1)、p値、そして有意性の判定が表示されます。
  5. 例のボタンを使うと、あらかじめ用意されたデータを読み込み、結果の確認や一般的な使い方の確認ができます。

FAQ

Yatesの連続性補正とは何ですか?
Yatesの連続性補正は、2×2表の標準的なカイ二乗式に対する調整です。観測頻度と期待頻度の絶対差から0.5を引いてから二乗します。これにより検定はより保守的になり、標本サイズや期待度数が小さいときの偽陽性(第1種過誤)のリスクを下げられます。
Yates補正と標準のカイ二乗検定は、いつ使い分ければよいですか?
期待度数が10未満のセルがある場合はYates補正を使います。期待度数がすべて10以上なら、標準のカイ二乗検定で十分です。期待度数が5未満の非常に小さい標本では、その状況ではさらに信頼性の高いFisherの正確検定を検討してください。
セルa、b、c、dは何を表しますか?
aはA群で結果1を経験した人数、bはA群で結果2の人数、cはB群で結果1の人数、dはB群で結果2の人数です。ワクチン研究なら、A群が接種群、B群が非接種群、結果1が感染、結果2が非感染を表します。
2×2表の自由度が常に1なのはなぜですか?
カイ二乗独立性検定の自由度は(行数 − 1)×(列数 − 1)です。2×2表なら(2−1)×(2−1)= 1 になります。つまり、周辺合計と1つのセル値がわかれば、他のセル値はすべて一意に決まり、自由なパラメータは1つだけになります。
Yates補正は統計的検出力を下げますか?
はい。検定をより保守的にすると、帰無仮説を棄却するためにより強い証拠が必要になります。批判者は、Yates補正が過剰補正になり、第二種過誤(真の効果を見逃すこと)のリスクを高めると主張します。期待度数が高い大きな標本では、この補正の影響はほとんどありません。小標本の2×2解析では、多くの現代統計家がFisherの正確検定を好みます。
この計算機を2×2より大きい表に使えますか?
いいえ。Yates補正は2×2分割表専用です。3×2や3×3など、より大きい表では、連続性補正を使わない標準のPearsonカイ二乗検定を使ってください。より大きい表では式も自由度も異なります。