Q: p値は実際には何を意味しますか？

p値は、帰無仮説が真であると仮定したときに、観測された値以上に極端な検定統計量が得られる確率です。H₀ が真である確率でも、結果が偶然起きた確率でもありません。p値が α（一般に 0.05）未満なら、H₀ が真なら観測データは意外だということなので、H₀ を棄却します。p値が α を上回る場合はデータが H₀ と整合的なので棄却しませんが、これは H₀ が正しいことの証明ではありません。

Q: 片側検定と両側検定はいつ使い分ければよいですか？

両方向の差が科学的に意味を持ち、特定の方向を強く予想する根拠がない場合は両側検定を使います。理論や先行証拠によって、データ収集前に効果の方向が明確に指定されている場合は片側検定を使います。結果を見てから有意にするために片側検定へ切り替えるのは p-hacking であり無効です。α=0.05 の片側検定は α=0.10 の両側検定に相当します。

Q: 有意水準 α とは何で、どう選べばよいですか？

有意水準 α は、第1種の誤り、つまり真の帰無仮説を誤って棄却してしまうことを許容する最大確率です。一般的には 0.05（5%）が使われますが、偽陽性のコストが特に高い場合（医療診断、安全クリティカルなシステム）には 0.01 が使われます。最近では、固定の閾値に頼る代わりに正確な p値を報告し、信頼区間や効果量と併せて解釈することが推奨されています。

Q: 第1種の誤りと第2種の誤りとは何ですか？

第1種の誤り（偽陽性）は、H₀ が真なのにそれを棄却してしまうことです。その確率は α です。第2種の誤り（偽陰性）は、H₀ が偽なのに棄却できないことです。その確率は β で、統計的検出力は 1−β です。α を下げると棄却基準が厳しくなり、第1種の誤りは減りますが第2種の誤りは増えます。サンプルサイズを増やすのが、両方を同時に減らす最も確実な方法です。

Q: この計算機はアンケートの比率にも使えますか？

はい。比率の Z検定モードはまさにそのためにあります。仮定する母比率 p₀（基準値または理論値）、サンプルサイズ n、観測された標本比率 p̂（成功数を n で割った値）を入力してください。計算機は標準式 Z = (p̂ − p₀) / √(p₀(1−p₀)/n) を適用します。n·p₀ と n·(1−p₀) がどちらも 5 または 10 を超える場合、正規近似は信頼できます。

Question 1

Z検定とT検定の違いは何ですか？

Accepted Answer

母標準偏差 σ が既知なら Z検定を使います。これにより標準正規分布を用いて正確な p値を計算できます。σ が未知で、標本標準偏差 s から推定しなければならない場合は T検定を使います。このとき検定統計量は自由度 n−1 の t分布に従い、追加の不確実性を考慮して正規分布より裾が厚くなります。サンプルサイズが大きくなると t分布は正規分布に近づくため、この違いは小標本で最も重要になります（おおむね n < 30）。

Question 2

p値は実際には何を意味しますか？

Accepted Answer

p値は、帰無仮説が真であると仮定したときに、観測された値以上に極端な検定統計量が得られる確率です。H₀ が真である確率でも、結果が偶然起きた確率でもありません。p値が α（一般に 0.05）未満なら、H₀ が真なら観測データは意外だということなので、H₀ を棄却します。p値が α を上回る場合はデータが H₀ と整合的なので棄却しませんが、これは H₀ が正しいことの証明ではありません。

Question 3

片側検定と両側検定はいつ使い分ければよいですか？

Accepted Answer

両方向の差が科学的に意味を持ち、特定の方向を強く予想する根拠がない場合は両側検定を使います。理論や先行証拠によって、データ収集前に効果の方向が明確に指定されている場合は片側検定を使います。結果を見てから有意にするために片側検定へ切り替えるのは p-hacking であり無効です。α=0.05 の片側検定は α=0.10 の両側検定に相当します。

Question 4

有意水準 α とは何で、どう選べばよいですか？

Accepted Answer

有意水準 α は、第1種の誤り、つまり真の帰無仮説を誤って棄却してしまうことを許容する最大確率です。一般的には 0.05（5%）が使われますが、偽陽性のコストが特に高い場合（医療診断、安全クリティカルなシステム）には 0.01 が使われます。最近では、固定の閾値に頼る代わりに正確な p値を報告し、信頼区間や効果量と併せて解釈することが推奨されています。

Question 5

第1種の誤りと第2種の誤りとは何ですか？

Accepted Answer

第1種の誤り（偽陽性）は、H₀ が真なのにそれを棄却してしまうことです。その確率は α です。第2種の誤り（偽陰性）は、H₀ が偽なのに棄却できないことです。その確率は β で、統計的検出力は 1−β です。α を下げると棄却基準が厳しくなり、第1種の誤りは減りますが第2種の誤りは増えます。サンプルサイズを増やすのが、両方を同時に減らす最も確実な方法です。

Question 6

この計算機はアンケートの比率にも使えますか？

Accepted Answer

はい。比率の Z検定モードはまさにそのためにあります。仮定する母比率 p₀（基準値または理論値）、サンプルサイズ n、観測された標本比率 p̂（成功数を n で割った値）を入力してください。計算機は標準式 Z = (p̂ − p₀) / √(p₀(1−p₀)/n) を適用します。n·p₀ と n·(1−p₀) がどちらも 5 または 10 を超える場合、正規近似は信頼できます。

シナリオ	結果	解釈
品質管理: x̄=10.01mm, μ₀=10mm, σ=0.03, n=50, α=0.05, 両側Z検定	Z=2.357, p=0.0184 → H₀を棄却	ボルトの平均径が10 mmの目標から有意にずれています。工程調整が必要です。
薬剤試験: x̄=12 mmHg, μ₀=10, s=3, n=30, α=0.05, 右側T検定	T=3.651, df=29, p=0.0005 → H₀を棄却	この薬は平均で血圧を10 mmHgより大きく下げる強い証拠があります。
A/B テスト: p̂=0.095, p₀=0.08, n=1000, α=0.05, 右側Z検定（比率）	Z=1.750, p=0.0401 → H₀を棄却	新しいボタンデザインは、クリック率を基準の 8% より有意に高めています。
燃費: x̄=29 mpg, μ₀=30, σ=2, n=40, α=0.01, 左側Z検定	Z=−3.162, p=0.0008 → H₀を棄却	1% 水準で、この車種の燃費が広告の 30 mpg を下回る証拠があります。

仮説検定計算機 - Z検定、T検定、P値

仮説検定計算機について

仮説検定の例

仮説検定計算機の使い方

仮説検定FAQ