표본비율의 표본분포 계산기

임의의 표본비율에 대한 표본분포의 평균, 표준오차, 정규성 조건, Z점수, 누적확률을 구합니다.

모비율 (p)과 표본 크기 (n)를 입력하세요. 특정 표본비율 (p̂)을 입력하면 해당 Z점수와 누적확률을 계산할 수 있습니다.

표본비율의 표본분포 계산기
임의의 표본비율에 대한 표본분포의 평균, 표준오차, 정규성 조건, Z점수, 누적확률을 구합니다.

표본비율의 표본분포란?

표본비율의 표본분포는, 실제 모비율이 p인 모집단에서 고정된 크기 n의 모든 가능한 무작위 표본을 뽑았을 때 나올 수 있는 표본비율 (p̂)의 범위를 설명하는 이론적 분포입니다. 이는 추론통계의 가장 기본적인 개념 중 하나이며, 설문조사 방법론, 가설 검정, 신뢰구간 구성의 토대가 됩니다. 표본분포의 평균은 모비율 p와 같습니다. 이것이 불편성의 성질입니다. 평균적으로 표본비율은 추정하는 모수와 같다는 뜻입니다. 표본분포의 표준편차는 비율의 표준오차로, σ(p̂) = √[p(1–p)/n]로 계산합니다. 표본 크기 n이 커질수록 표준오차는 작아지며, 더 큰 표본일수록 표본비율이 실제 값 p 주변에 더 촘촘히 모입니다. 중심극한정리에 따르면 np ≥ 10 그리고 n(1–p) ≥ 10 두 조건을 모두 만족하면 표본분포를 대략 정규분포로 볼 수 있습니다. 이 조건은 표본에서 성공과 실패의 수가 충분히 커서 정규근사가 신뢰할 만하다는 것을 보장합니다. 하나라도 만족하지 못하면, 특히 표본이 작거나 비율이 0 또는 1에 매우 가까운 경우에는 이항분포를 사용해야 합니다. 특정한 관측 표본비율 p̂를 입력하면 계산기는 Z점수를 계산합니다. 이는 p̂가 평균에서 표준오차 몇 개만큼 떨어져 있는지를 나타내며, Z = (p̂ – p) / σ(p̂)로 구합니다. 절대값이 큰 Z점수는 주어진 모비율 가정하에서 관측된 표본비율이 우연히 나올 가능성이 낮다는 뜻이며, 이것이 가설 검정의 기반입니다. 누적확률 P(p̂ < x)는 지정한 모집단에서 크기 n의 표본을 무작위로 뽑았을 때 x 이하의 표본비율이 관측될 확률을 뜻합니다. 보완확률 P(p̂ > x)는 x보다 큰 비율이 관측될 확률입니다. 이 두 값을 함께 보면 관측한 표본비율이 이론적 분포에 비해 얼마나 극단적인지 판단할 수 있습니다. 이 개념은 여론조사(후보자의 실제 지지율이 임계값을 넘는지 추정), 품질 관리(배치의 불량률이 허용 기준을 넘는지 판단), 의료 연구(치료 반응 비율이 과거 기준과 다른지 평가) 등에 널리 활용됩니다.

표본분포 예시

세 가지 사례로 평균, 표준오차, 정규성 검정, Z점수 계산을 보여줍니다.

매개변수핵심 결과설명
p=0.60, n=100, p̂=0.65μ=0.60, σ=0.049, Z=1.02, P(<0.65)≈0.846정규성 조건을 만족합니다(np=60, n(1-p)=40). 관측된 65%는 모비율보다 약 1 표준오차 높습니다.
p=0.50, n=400, p̂=0.53μ=0.50, σ=0.025, Z=1.20, P(<0.53)≈0.885표본이 클수록 정밀도가 높아집니다. 표본 크기가 4배가 되면 표준오차는 절반이 되어, 0.50에서의 차이를 더 쉽게 확인할 수 있습니다.
p=0.05, n=50μ=0.05, σ=0.031, 정규성 실패np=2.5 < 10 이므로 정규성 조건을 만족하지 않습니다. 작은 비율과 작은 표본에서는 정확한 이항분포를 사용하세요.

표본비율 표본분포 계산기 사용법

  1. 모비율 (p)을 0과 1 사이의 소수로 입력하세요(끝점 제외). 이는 모집단의 알려졌거나 가정한 실제 비율입니다.
  2. 표본 크기 (n)를 양의 정수로 입력하세요. 이것이 표준오차를 결정하고 정규성 조건 충족 여부에 영향을 줍니다.
  3. 필요하면 표본비율 (p̂)을 입력해 Z점수와 누적확률 P(p̂ < x), P(p̂ > x)를 계산하세요.
  4. 계산을 누르면 평균, 표준오차, 정규성 검정 결과와 (p̂를 입력한 경우) Z점수 및 확률이 표시됩니다.
  5. 초기화를 누르면 모든 입력이 지워지고 새 계산을 시작할 수 있습니다.

비율 표본분포 FAQ

표본비율의 표준오차는 무엇인가요?
표준오차는 표본분포의 표준편차로, 표본마다 표본비율이 얼마나 달라지는지 측정합니다. 값은 √[p(1–p)/n]입니다. 표준오차가 작을수록 표본비율은 실제 모비율 p 주위에 더 촘촘히 모입니다.
표본분포가 근사적으로 정규가 되는 시점은 언제인가요?
np ≥ 10 그리고 n(1–p) ≥ 10 두 조건을 모두 만족할 때 정규근사가 유효합니다. 어느 하나라도 실패하면 분포가 비대칭이 되고, 정규근사에 기반한 확률 계산은 부정확해집니다. 이 경우에는 정확한 이항분포를 사용하세요.
표본 크기를 늘리면 분포는 어떻게 변하나요?
n이 커지면 표준오차는 1/√n에 비례해 감소하여 표본분포가 좁아집니다. 평균은 표본 크기와 상관없이 p와 같습니다. 분포가 좁아질수록 표본비율이 실제 모비율에 더 가까워질 가능성이 높아져 추정과 추론이 더 정확해집니다.
표본비율의 Z점수가 2라는 뜻은 무엇인가요?
Z점수가 2라는 것은 관측된 표본비율 p̂가 모비율 p보다 2 표준오차 높다는 뜻입니다. 정규근사에서 이렇게 크거나 더 큰 Z점수가 순전히 우연히 나올 확률은 약 2.3%입니다(단측). 이는 가정한 모비율에 대한 강하지만 결정적이지 않은 반증입니다.
이 계산기는 0이나 1에 가까운 비율도 처리할 수 있나요?
계산은 가능하지만, np < 10 또는 n(1–p) < 10이면 정규성 조건 실패로 표시됩니다. p = 0.02 또는 p = 0.98 같은 극단적 비율에서는 표본분포가 비대칭이므로 정확한 확률 계산에는 이항분포를 사용해야 합니다.
비율의 표준편차와 표준오차는 어떻게 다른가요?
이진 변수의 모표준편차는 개별 관측값 내부의 변동성을 나타냅니다: σ = √[p(1–p)]. 표본비율의 표준오차는 반복 표집에서 표본비율들 사이의 변동성을 나타냅니다: σ(p̂) = √[p(1–p)/n]. 표준오차는 1/√n 만큼 더 작으며, 여러 관측값을 평균내는 효과를 반영합니다.