Q: 片側検定と両側検定の違いは何ですか？

両側検定はどちらの方向の差も調べ、α を両端に均等に分けます。片側検定は α 全体を一方向に集中させるため、その方向の効果を検出する力は高くなりますが、データを見る前に方向を決めておく場合にのみ有効です。境界的な両側結果を救うために片側検定へ切り替えるのは p-hacking です。

Q: 自由度はどのように決まりますか？

自由度（df）は、データ中の独立した情報の数を表します。1 標本 t 検定では df = n − 1。独立 2 標本 t 検定では df = n₁ + n₂ − 2。r × c の分割表におけるカイ二乗独立性検定では df = (r − 1)(c − 1)。一元配置分散分析の F 検定では、分子の自由度 = k − 1（群数 − 1）、分母の自由度 = N − k（総観測数 − 群数）です。

Q: p-hacking とは何で、なぜ有害なのですか？

p-hacking とは、p < 0.05 が出るまで複数の検定、サブグループ、モデル仕様を試し、出た結果だけを報告する行為です。真の第 1 種過誤率を α を大幅に超えて膨らませ、再現しない偽陽性を生みます。防ぐには、分析計画を事前登録し、多重比較補正（例: Bonferroni 補正）を行い、実施したすべての検定を報告します。

Q: p 値が非常に小さいと、結果は重要でないという意味ですか？

はい、あり得ます。十分に大きい標本があれば、きわめて小さな効果（たとえば薬が血圧を 0.1 mmHg しか下げない場合）でも p < 0.001 になります。統計的有意性と実用的有意性は別物です。p 値と併せて効果量（Cohen's d、オッズ比、R² など）を必ず計算して報告し、その効果が実際に意味のある大きさかを読者が判断できるようにしてください。

Question 1

p 値は何を測っているのですか？

Accepted Answer

p 値は、帰無仮説が真であると仮定したときに、計算した検定統計量と同じかそれ以上に極端な値が観測される確率を表します。H₀ のもとでデータがどれだけ意外かを数値化するものです。H₀ が真である確率、効果の大きさ、誤りを犯した確率を表すものではありません。

Question 2

なぜ α = 0.05 が慣例的な閾値なのですか？

Accepted Answer

0.05 という閾値は、Ronald Fisher が 1920 年代に広めた便利な慣例であり、普遍的な真理ではありません。これは 5% の偽陽性を許容することを意味します。分野によって閾値は異なり、素粒子物理では通常 p < 5×10⁻⁷、ゲノム科学では p < 5×10⁻⁸、臨床試験では α = 0.01 が使われることがあります。適切な閾値は、偽陽性と偽陰性のコスト次第です。

Question 3

片側検定と両側検定の違いは何ですか？

Accepted Answer

両側検定はどちらの方向の差も調べ、α を両端に均等に分けます。片側検定は α 全体を一方向に集中させるため、その方向の効果を検出する力は高くなりますが、データを見る前に方向を決めておく場合にのみ有効です。境界的な両側結果を救うために片側検定へ切り替えるのは p-hacking です。

Question 4

自由度はどのように決まりますか？

Accepted Answer

自由度（df）は、データ中の独立した情報の数を表します。1 標本 t 検定では df = n − 1。独立 2 標本 t 検定では df = n₁ + n₂ − 2。r × c の分割表におけるカイ二乗独立性検定では df = (r − 1)(c − 1)。一元配置分散分析の F 検定では、分子の自由度 = k − 1（群数 − 1）、分母の自由度 = N − k（総観測数 − 群数）です。

Question 5

p-hacking とは何で、なぜ有害なのですか？

Accepted Answer

p-hacking とは、p < 0.05 が出るまで複数の検定、サブグループ、モデル仕様を試し、出た結果だけを報告する行為です。真の第 1 種過誤率を α を大幅に超えて膨らませ、再現しない偽陽性を生みます。防ぐには、分析計画を事前登録し、多重比較補正（例: Bonferroni 補正）を行い、実施したすべての検定を報告します。

Question 6

p 値が非常に小さいと、結果は重要でないという意味ですか？

Accepted Answer

はい、あり得ます。十分に大きい標本があれば、きわめて小さな効果（たとえば薬が血圧を 0.1 mmHg しか下げない場合）でも p < 0.001 になります。統計的有意性と実用的有意性は別物です。p 値と併せて効果量（Cohen's d、オッズ比、R² など）を必ず計算して報告し、その効果が実際に意味のある大きさかを読者が判断できるようにしてください。

検定設定	P値	α = 0.05 での判定
Z検定、両側、Z = 2.5、α = 0.05	p = 0.0124	p < 0.05 → 有意。H₀ のもとで \|Z\| ≥ 2.5 となる確率は約 1.24% です。
t検定、右側、t = 2.1、df = 15、α = 0.05	p = 0.0267	p < 0.05 → 有意。df = 15、t = 2.1 の片側 t 検定では p ≈ 0.027 です。
カイ二乗検定、右側、χ² = 18.3、df = 10、α = 0.01	p = 0.0499	p > 0.01 → α = 0.01 では有意でない。同じ結果は α = 0.05 では有意です。
F検定、右側、F = 3.8、df1 = 2、df2 = 27、α = 0.05	p = 0.0347	p < 0.05 → 有意。自由度 2 と 27 の分散分析の F 比 3.8 です。

P値計算器 - Z・t・F・カイ二乗検定

P値計算器について

使用例

P値計算器の使い方

よくある質問