仮説検定計算機 - Z検定、T検定、P値

平均と比率の Z検定・T検定を実行できます。サンプルデータを入力するだけで、数秒で検定統計量、p値、臨界値を算出します。

検定タイプと対立仮説を選び、データを入力して計算をクリックすると、帰無仮説を棄却するかどうかを判定できます。

仮説検定計算機 - Z検定、T検定、P値
平均と比率の Z検定・T検定を実行できます。サンプルデータを入力するだけで、数秒で検定統計量、p値、臨界値を算出します。

仮説検定計算機について

仮説検定は推測統計の基盤です。収集したデータが理論的な主張である帰無仮説と整合的か、それともその主張を棄却できるほど十分な証拠があるかを、原理に基づく確率的な枠組みで判断できます。医学、心理学、経済学、工学の品質管理、A/Bテストなど、あらゆる実験は最終的に何らかの仮説検定に行き着きます。 帰無仮説 (H₀) は既定の仮定です。変化は起きていない、処置に効果はない、工程は目標どおり、比率は変わっていない、という考え方です。対立仮説 (H₁) は検出したい内容で、平均が変化した、比率が変わった、あるいは一方の処置が他方より優れている、といった主張です。有意水準 α は通常 0.05 か 0.01 で、H₀ が真であるのに誤って棄却してしまう確率(第1種の誤り)です。検定の p値が α より小さければ、H₀ を棄却します。 母標準偏差 σ が既知で、サンプルが十分大きい(n ≥ 30)か母集団が正規分布している場合は、平均の Z検定が適しています。検定統計量は Z = (x̄ − μ₀) / (σ / √n) です。σ が既知なので、この統計量は標準正規分布に厳密に従い、p値は正規表から求めます。σ が未知で、現実の研究で最もよくある状況では、標本標準偏差 s を用いる平均の T検定を使います。この場合、検定統計量 T = (x̄ − μ₀) / (s / √n) は自由度 df = n − 1 の t分布に従います。小標本では t分布の裾が正規分布より厚いため、有意性に達しにくくなります。これは σ に関する追加的不確実性に対する妥当なペナルティです。 比率の Z検定は、観測された標本比率 p̂ が仮定された母比率 p₀ と整合的かを検定します。標準誤差は √(p₀(1 − p₀) / n)、検定統計量は Z = (p̂ − p₀) / SE です。この検定は A/B テスト、臨床試験の主要評価項目、品質管理の不良率管理図で広く使われます。 両側検定では、|統計量| が臨界値を上回ると H₀ を棄却し、どちらの方向のずれも捉えます。片側検定(左側または右側)では、あらかじめ方向を指定します。これによりその方向の変化を検出する力は高まりますが、逆方向の予期しない変化は検出できません。表示される臨界値は右側境界であり、左側検定ではその符号反転が該当します。 p値は、H₀ が真であると仮定したときに、観測された統計量以上に極端な値が得られる確率です。p値が 0.03 だからといって帰無仮説が真である確率が 3% という意味ではありません。H₀ が真なら、偶然の標本抽出だけでこれほど極端、またはそれ以上に極端なデータが出る確率が 3% しかない、という意味です。統計的有意性は実用的有意性と同じではありません。サンプルサイズが大きいと小さな効果でも非常に有意になり得ますし、小さいサンプルでは大きな効果でも有意にならないことがあります。p値は必ず効果量と信頼区間と併せて解釈してください。

仮説検定の例

各検定タイプと片側・両側の向きを示す実例です。

シナリオ結果解釈
品質管理: x̄=10.01mm, μ₀=10mm, σ=0.03, n=50, α=0.05, 両側Z検定Z=2.357, p=0.0184 → H₀を棄却ボルトの平均径が10 mmの目標から有意にずれています。工程調整が必要です。
薬剤試験: x̄=12 mmHg, μ₀=10, s=3, n=30, α=0.05, 右側T検定T=3.651, df=29, p=0.0005 → H₀を棄却この薬は平均で血圧を10 mmHgより大きく下げる強い証拠があります。
A/B テスト: p̂=0.095, p₀=0.08, n=1000, α=0.05, 右側Z検定(比率)Z=1.750, p=0.0401 → H₀を棄却新しいボタンデザインは、クリック率を基準の 8% より有意に高めています。
燃費: x̄=29 mpg, μ₀=30, σ=2, n=40, α=0.01, 左側Z検定Z=−3.162, p=0.0008 → H₀を棄却1% 水準で、この車種の燃費が広告の 30 mpg を下回る証拠があります。

仮説検定計算機の使い方

  1. 検定タイプを選択します。σ が既知なら Z検定(平均)、σ が未知で標本標準偏差があるなら T検定(平均)、カテゴリ結果なら Z検定(比率)を選びます。
  2. 対立仮説の方向を選択します。両側はどちらの変化も検出、左側は減少、右側は増加を検出します。
  3. 帰無仮説値(平均検定なら μ₀、比率検定なら p₀)、選択した有意水準 α(通常は 0.05)、サンプルサイズ n を入力します。
  4. 残りの項目を入力します。Z検定(平均)は標本平均 x̄ と母標準偏差 σ、T検定は標本平均 x̄ と標本標準偏差 s、Z検定(比率)は標本比率 p̂ を入力します。
  5. 計算をクリックします。ツールは検定統計量、自由度(T検定のみ)、p値、臨界値、棄却/棄却できないという判定を表示します。

仮説検定FAQ

Z検定とT検定の違いは何ですか?
母標準偏差 σ が既知なら Z検定を使います。これにより標準正規分布を用いて正確な p値を計算できます。σ が未知で、標本標準偏差 s から推定しなければならない場合は T検定を使います。このとき検定統計量は自由度 n−1 の t分布に従い、追加の不確実性を考慮して正規分布より裾が厚くなります。サンプルサイズが大きくなると t分布は正規分布に近づくため、この違いは小標本で最も重要になります(おおむね n < 30)。
p値は実際には何を意味しますか?
p値は、帰無仮説が真であると仮定したときに、観測された値以上に極端な検定統計量が得られる確率です。H₀ が真である確率でも、結果が偶然起きた確率でもありません。p値が α(一般に 0.05)未満なら、H₀ が真なら観測データは意外だということなので、H₀ を棄却します。p値が α を上回る場合はデータが H₀ と整合的なので棄却しませんが、これは H₀ が正しいことの証明ではありません。
片側検定と両側検定はいつ使い分ければよいですか?
両方向の差が科学的に意味を持ち、特定の方向を強く予想する根拠がない場合は両側検定を使います。理論や先行証拠によって、データ収集前に効果の方向が明確に指定されている場合は片側検定を使います。結果を見てから有意にするために片側検定へ切り替えるのは p-hacking であり無効です。α=0.05 の片側検定は α=0.10 の両側検定に相当します。
有意水準 α とは何で、どう選べばよいですか?
有意水準 α は、第1種の誤り、つまり真の帰無仮説を誤って棄却してしまうことを許容する最大確率です。一般的には 0.05(5%)が使われますが、偽陽性のコストが特に高い場合(医療診断、安全クリティカルなシステム)には 0.01 が使われます。最近では、固定の閾値に頼る代わりに正確な p値を報告し、信頼区間や効果量と併せて解釈することが推奨されています。
第1種の誤りと第2種の誤りとは何ですか?
第1種の誤り(偽陽性)は、H₀ が真なのにそれを棄却してしまうことです。その確率は α です。第2種の誤り(偽陰性)は、H₀ が偽なのに棄却できないことです。その確率は β で、統計的検出力は 1−β です。α を下げると棄却基準が厳しくなり、第1種の誤りは減りますが第2種の誤りは増えます。サンプルサイズを増やすのが、両方を同時に減らす最も確実な方法です。
この計算機はアンケートの比率にも使えますか?
はい。比率の Z検定モードはまさにそのためにあります。仮定する母比率 p₀(基準値または理論値)、サンプルサイズ n、観測された標本比率 p̂(成功数を n で割った値)を入力してください。計算機は標準式 Z = (p̂ − p₀) / √(p₀(1−p₀)/n) を適用します。n·p₀ と n·(1−p₀) がどちらも 5 または 10 を超える場合、正規近似は信頼できます。