標本比率の抽出分布計算機
任意の標本比率の抽出分布について、平均、標準誤差、正規条件、Z スコア、累積確率を求めます。
母比率 (p) と標本サイズ (n) を入力します。特定の標本比率 (p̂) を入力すると、対応する Z スコアと累積確率を計算できます。
標本比率の抽出分布計算機
任意の標本比率の抽出分布について、平均、標準誤差、正規条件、Z スコア、累積確率を求めます。
標本比率の抽出分布について
標本比率の抽出分布は、母集団の真の比率が p であるとき、固定サイズ n のあらゆる無作為標本から得られる標本比率 (p̂) の取り得る値の範囲を表す理論分布です。推測統計の最も基本的な概念の一つであり、調査手法、仮説検定、信頼区間の構築の多くを支えています。
抽出分布の平均は母比率 p に等しくなります。これは不偏性を意味し、平均的には標本比率が推定対象の母数と一致するという性質です。抽出分布の標準偏差は比率の標準誤差と呼ばれ、σ(p̂) = √[p(1–p)/n] で求めます。標本サイズ n が大きくなるほど標準誤差は小さくなり、標本比率は真の値 p の周辺により強く集中します。
中心極限定理によれば、np ≥ 10 かつ n(1–p) ≥ 10 の 2 条件を満たすとき、抽出分布はおおむね正規分布で近似できます。これは、標本中の「成功」と「失敗」の数が十分に大きく、正規近似が信頼できることを保証します。いずれか一方でも満たさない場合、特に標本が小さいか比率が 0 や 1 に極端に近い場合は、二項分布を使うべきです。
具体的な観測標本比率 p̂ を入力すると、計算機は Z スコアを求めます。これは p̂ が平均から標準誤差何個分離れているかを表し、Z = (p̂ – p) / σ(p̂) で計算します。絶対値の大きい Z スコアは、仮定した母比率のもとでは観測された標本比率が偶然に生じにくいことを示し、仮説検定の基礎になります。
累積確率 P(p̂ < x) は、指定した母集団からサイズ n の標本を無作為抽出したとき、x 以下の標本比率が得られる確率を表します。補完確率 P(p̂ > x) は、x を超える比率が得られる確率です。これらを合わせることで、観測した標本比率が理論分布に対してどれほど極端かを判断できます。
この概念は、世論調査(候補者の真の支持率がしきい値を上回る確率の推定)、品質管理(ロットの欠陥率が許容基準を超えるかの判定)、医療研究(治療への反応割合が過去の基準と異なるかの評価)などに広く使われています。
抽出分布の例
3 つのシナリオで、平均、標準誤差、正規性判定、Z スコアの計算を示します。
| パラメータ | 主な結果 | 注記 |
|---|---|---|
| p=0.60, n=100, p̂=0.65 | μ=0.60, σ=0.049, Z=1.02, P(<0.65)≈0.846 | 正規性条件を満たしています(np=60, n(1-p)=40)。観測された 65% は母比率より約 1 標準誤差上です。 |
| p=0.50, n=400, p̂=0.53 | μ=0.50, σ=0.025, Z=1.20, P(<0.53)≈0.885 | 大きな標本は精度を高めます。標本サイズが 4 倍になると標準誤差は半分になり、0.50 からのずれを見つけやすくなります。 |
| p=0.05, n=50 | μ=0.05, σ=0.031, 正規性不合格 | np=2.5 < 10 のため正規性条件を満たしません。小さな比率と小標本では、正確な二項分布を使ってください。 |
標本比率の抽出分布計算機の使い方
- 母比率 (p) を 0 から 1 の間の小数(端点を除く)で入力します。これは母集団の既知または仮定された真の比率です。
- 標本サイズ (n) を正の整数で入力します。これが標準誤差を決め、正規性条件を満たすかどうかに影響します。
- 必要に応じて標本比率 (p̂) を入力すると、Z スコアと累積確率 P(p̂ < x)、P(p̂ > x) を計算できます。
- [計算]を押すと、平均、標準誤差、正規性判定の結果、および(p̂ を入力した場合)Z スコアと確率が表示されます。
- [リセット]を押すと、すべての欄が消去され、新しく計算を始められます。
比率の抽出分布に関する FAQ
標本比率の標準誤差とは何ですか?
標準誤差は抽出分布の標準偏差で、標本ごとの標本比率のばらつきの大きさを表します。式は √[p(1–p)/n] です。標準誤差が小さいほど、標本比率は真の母比率 p の周りにより密に集まります。
抽出分布が近似的に正規になるのはいつですか?
np ≥ 10 かつ n(1–p) ≥ 10 の両方を満たすと、正規近似が有効です。どちらか一方でも満たさないと、分布は歪み、正規近似に基づく確率計算は不正確になります。その場合は、正確な確率を求めるために二項分布を使ってください。
標本サイズを増やすと分布はどう変わりますか?
n を増やすと標準誤差は 1/√n に比例して小さくなり、抽出分布は狭くなります。平均は標本サイズにかかわらず p のままです。分布が狭いほど、標本比率が真の母比率に近づきやすくなり、推定と推測の精度が上がります。
標本比率の Z スコアが 2 だと何を意味しますか?
Z スコアが 2 ということは、観測された標本比率 p̂ が母比率 p より 2 標準誤差上にあることを意味します。正規近似では、これほど大きいかそれ以上の Z スコアが偶然に出る確率は約 2.3%(片側)です。これは仮定した母比率に対する強いが決定的ではない反証です。
この計算機は 0 や 1 に近い比率も扱えますか?
結果は計算できますが、np < 10 または n(1–p) < 10 のときは正規性条件が満たされないと表示されます。極端な比率(たとえば p = 0.02 や p = 0.98)では抽出分布が歪むため、正確な確率計算には二項分布を使うべきです。
比率の標準偏差と標準誤差の違いは何ですか?
二値変数の母集団標準偏差は、個々の観測値のばらつきを表します:σ = √[p(1–p)]。比率の標準誤差は、繰り返し標本抽出したときの標本比率のばらつきを表します:σ(p̂) = √[p(1–p)/n]。標準誤差は 1/√n の分だけ小さくなり、複数観測の平均化効果を反映します。