P値計算器 - Z・t・F・カイ二乗検定

Z、t、F、カイ二乗のいずれの検定統計量からでも p 値を求め、両側・右側・左側の選択で即座に有意性を判断できます。

統計検定の種類と片側/両側を選び、検定統計量と自由度を入力すると、正確な p 値と有意性の判定が得られます。

P値計算器 - Z・t・F・カイ二乗検定
Z、t、F、カイ二乗のいずれの検定統計量からでも p 値を求め、両側・右側・左側の選択で即座に有意性を判断できます。

P値計算器について

p 値とは、帰無仮説が真であると仮定したときに、実際に観測された検定統計量と同じか、それ以上に極端な値が得られる確率です。これは古典的な統計検定のほぼすべてにおける中心的な出力であり、帰無仮説を棄却するかどうかを判断するための主要な基準です。p 値が小さいほど、帰無仮説のもとでそのデータが得られる可能性は低く、対立仮説を支持する証拠になります。 手順は通常、帰無仮説 H₀(一般に効果なし、差なし、関連なしを表す)と対立仮説 H₁ の設定から始まります。次にデータを収集し、検定統計量(Z、t、F、χ²)を計算し、その統計量の H₀ 下での確率分布を用いて p 値を求めます。p 値が事前に定めた有意水準 α(最も一般的なのは 0.05)以下であれば、H₀ を棄却し、結果を統計的に有意と判断します。 検定統計量によって従う確率分布は異なります。Z 統計量は標準正規分布に従い、母標準偏差が既知、または標本が非常に大きい場合に使います。t 統計量は特定の自由度を持つ Student の t 分布に従い(1 標本検定では df = n − 1)、母標準偏差が未知で標本が小〜中規模のときに使います。F 統計量は分子自由度と分母自由度を持つ F 分布に従い、分散分析や分散の等質性に関する F 検定の基礎になります。カイ二乗統計量は自由度 df のカイ二乗分布に従い、分割表の独立性検定や適合度検定に使われます。 片側/両側の種類は、p 値を計算するために分布のどの領域を使うかを決めます。対立仮説が非方向的(H₁: μ ≠ μ₀)なら両側検定を用い、p 値は両端の確率を合計します。対立仮説が正の方向(H₁: μ > μ₀)なら右側検定、負の方向(H₁: μ < μ₀)なら左側検定を使います。F 検定とカイ二乗検定は実務上もともと片側であり(検定統計量は負にならない)、標準的には右側 p 値が報告されます。 よくある重要な誤解は、p 値が H₀ が真である確率だというものです。そうではありません。p 値は条件付き確率であり、P( H₀ が真のときにこれほど極端なデータが得られる ) です。H₀ や H₁ が真である確率は示しません。それを知るには事前確率を用いるベイズ推論が必要です。もう一つの誤解は、p < 0.05 なら効果が大きい、あるいは実用上重要だというものです。統計的有意性は標本サイズに依存します。十分に大きい標本があれば、取るに足らない小さな効果でも p < 0.05 になります。必ず p 値と併せて効果量を報告してください。 有意水準 α はデータを見る前に決めるべきで、偽陽性(第 1 種過誤)の許容リスクを反映する必要があります。分野によって慣例は異なり、多くの生物医学・社会科学研究では α = 0.05 が標準、偽陽性のコストが高い場合は α = 0.01 が一般的、ゲノムワイド関連解析では同時に多数の検定を行うため α = 5 × 10⁻⁸ が用いられます。この計算器は α = 0.01、0.05、0.10 に対応しています。

使用例

対応する各検定の例を 4 つ示し、入力、p 値、有意性の判定を確認できます。

検定設定P値α = 0.05 での判定
Z検定、両側、Z = 2.5、α = 0.05p = 0.0124p < 0.05 → 有意。H₀ のもとで |Z| ≥ 2.5 となる確率は約 1.24% です。
t検定、右側、t = 2.1、df = 15、α = 0.05p = 0.0267p < 0.05 → 有意。df = 15、t = 2.1 の片側 t 検定では p ≈ 0.027 です。
カイ二乗検定、右側、χ² = 18.3、df = 10、α = 0.01p = 0.0499p > 0.01 → α = 0.01 では有意でない。同じ結果は α = 0.05 では有意です。
F検定、右側、F = 3.8、df1 = 2、df2 = 27、α = 0.05p = 0.0347p < 0.05 → 有意。自由度 2 と 27 の分散分析の F 比 3.8 です。

P値計算器の使い方

  1. 検定統計量の計算方法に合った検定タイプ(Z検定、t検定、F検定、カイ二乗検定)を選びます。
  2. 片側/両側を選択します。H₁: ≠ なら両側、H₁: > なら右側、H₁: < なら左側です。
  3. 「検定統計量」欄に値を入力します。t検定、F検定、カイ二乗検定では自由度も入力してください(F検定は 2 つ)。
  4. 有意水準 α を設定し、「計算」をクリックすると p 値と有意性の判定が表示されます。
  5. p ≤ α なら H₀ を棄却し、統計的に有意と報告します。p > α なら H₀ を棄却できません。必ず効果量も併記してください。

よくある質問

p 値は何を測っているのですか?
p 値は、帰無仮説が真であると仮定したときに、計算した検定統計量と同じかそれ以上に極端な値が観測される確率を表します。H₀ のもとでデータがどれだけ意外かを数値化するものです。H₀ が真である確率、効果の大きさ、誤りを犯した確率を表すものではありません。
なぜ α = 0.05 が慣例的な閾値なのですか?
0.05 という閾値は、Ronald Fisher が 1920 年代に広めた便利な慣例であり、普遍的な真理ではありません。これは 5% の偽陽性を許容することを意味します。分野によって閾値は異なり、素粒子物理では通常 p < 5×10⁻⁷、ゲノム科学では p < 5×10⁻⁸、臨床試験では α = 0.01 が使われることがあります。適切な閾値は、偽陽性と偽陰性のコスト次第です。
片側検定と両側検定の違いは何ですか?
両側検定はどちらの方向の差も調べ、α を両端に均等に分けます。片側検定は α 全体を一方向に集中させるため、その方向の効果を検出する力は高くなりますが、データを見る前に方向を決めておく場合にのみ有効です。境界的な両側結果を救うために片側検定へ切り替えるのは p-hacking です。
自由度はどのように決まりますか?
自由度(df)は、データ中の独立した情報の数を表します。1 標本 t 検定では df = n − 1。独立 2 標本 t 検定では df = n₁ + n₂ − 2。r × c の分割表におけるカイ二乗独立性検定では df = (r − 1)(c − 1)。一元配置分散分析の F 検定では、分子の自由度 = k − 1(群数 − 1)、分母の自由度 = N − k(総観測数 − 群数)です。
p-hacking とは何で、なぜ有害なのですか?
p-hacking とは、p < 0.05 が出るまで複数の検定、サブグループ、モデル仕様を試し、出た結果だけを報告する行為です。真の第 1 種過誤率を α を大幅に超えて膨らませ、再現しない偽陽性を生みます。防ぐには、分析計画を事前登録し、多重比較補正(例: Bonferroni 補正)を行い、実施したすべての検定を報告します。
p 値が非常に小さいと、結果は重要でないという意味ですか?
はい、あり得ます。十分に大きい標本があれば、きわめて小さな効果(たとえば薬が血圧を 0.1 mmHg しか下げない場合)でも p < 0.001 になります。統計的有意性と実用的有意性は別物です。p 値と併せて効果量(Cohen's d、オッズ比、R² など)を必ず計算して報告し、その効果が実際に意味のある大きさかを読者が判断できるようにしてください。