신뢰구간 계산기 - 평균과 비율
표본 통계량 또는 원자료로 모집단 평균의 신뢰구간 계산
표본 평균, 표준편차, 표본 크기를 입력하거나 원자료를 제공해 90%, 95%, 99% 신뢰수준의 신뢰구간을 계산합니다.
신뢰구간 계산기 - 평균과 비율
표본 통계량 또는 원자료로 모집단 평균의 신뢰구간 계산
신뢰구간 계산기 소개
신뢰구간(CI)은 실제 모집단 모수—가장 흔하게는 모집단 평균—를 포함할 가능성이 높은 값의 범위이며, 특정 신뢰수준으로 표현됩니다. 신뢰구간은 추론통계에서 가장 널리 쓰이는 도구 중 하나로, 추정의 불확실성을 정량화하고 정확도를 명확하게 전달하는 데 도움이 됩니다.
모집단 표준편차를 모르고 표본 크기가 충분히 큰 경우, 모집단 평균의 신뢰구간 공식은 CI = x̄ ± z* × (s / √n)입니다. 여기서 x̄는 표본 평균, s는 표본 표준편차, n은 표본 크기, z*는 선택한 신뢰수준에 대응하는 표준정규분포의 임계값입니다. 95% CI의 z*는 1.96이며, 90%는 약 1.645, 99%는 약 2.576입니다.
s / √n은 평균의 표준오차(SE)라고 하며, 표본 평균이 표본마다 얼마나 변할 것으로 예상되는지를 나타냅니다. 표본 크기가 클수록 SE는 작아지고, 구간은 더 좁고 정밀해집니다. 오차범위(MOE)는 z* × SE이며, CI의 하한은 x̄ − MOE, 상한은 x̄ + MOE입니다.
신뢰구간을 올바르게 해석하는 것이 중요합니다. 95% 신뢰구간이 실제 평균이 이 특정 구간 안에 있을 확률이 95%라는 뜻은 아닙니다. 더 정확히 말하면, 같은 표본추출 과정을 여러 번 반복해 매번 CI를 계산하면 그중 약 95%가 실제 평균을 포함한다는 뜻입니다. 신뢰는 개별 구간이 아니라 절차에 있습니다.
신뢰구간은 임상시험에서 치료 효과를 보고할 때, 여론조사에서 오차범위를 제시할 때, 품질관리에서 공정 평균을 모니터링할 때, 그리고 표본으로부터 추정이 필요한 모든 과학 연구에서 사용됩니다. 이 계산기는 z 분포(정규 근사)를 사용하며, 대규모 표본(n ≥ 30)이나 모집단 분포가 거의 정규인 경우에 정확합니다. 분포를 모르는 작은 표본에는 t 분포 기반 구간이 더 적절합니다.
예시
아래 표는 대표적인 통계 상황의 신뢰구간 계산을 보여줍니다.
| 입력 | 95% CI | 상황 |
|---|---|---|
| x̄=75, s=5, n=100, 95% CI | (74.02, 75.98) | 학생 시험 점수 — 대규모 표본 |
| x̄=250, s=10, n=50, 99% CI | (246.36, 253.64) | 제품 무게(그램) — 높은 신뢰수준 |
| data: 22,25,21,24,23,26,20, 90% CI | (21.66, 24.34) | 일일 기온 — 작은 원자료 세트 |
| x̄=35, s=8, n=200, 95% CI | (33.89, 36.11) | 평균 배송 시간(분) |
신뢰구간 계산기 사용 방법
- 이미 표본 평균, 표준편차, 표본 크기가 있다면 “요약 통계량”을 선택하고, 개별 값을 입력하려면 “원자료”를 선택하세요.
- 신뢰수준을 선택하세요: 90% (z=1.645), 95% (z=1.96), 99% (z=2.576). 신뢰수준이 높을수록 구간은 더 넓어집니다.
- 요약 통계량의 경우 표본 평균(x̄), 표본 표준편차(s ≥ 0), 표본 크기(n ≥ 2)를 입력하세요. 원자료의 경우 쉼표나 공백으로 구분된 숫자를 입력하세요.
- “계산”을 클릭하면 신뢰구간의 상하한, 오차범위, 표준오차가 표시됩니다.
- 결과 해석: 구간(하한, 상한)은 반복 표본추출에서 선택한 신뢰수준으로 실제 모집단 평균을 포착하는 범위입니다.
자주 묻는 질문
95% 신뢰구간은 무엇을 뜻하나요?
95% 신뢰구간이란 같은 표본추출 절차를 여러 번 반복하고 매번 신뢰구간을 계산했을 때, 그중 약 95%가 실제 모집단 평균을 포함한다는 뜻입니다. 이것이 특정 구간 안에 실제 평균이 있을 확률이 95%라는 뜻은 아닙니다. 계산이 끝난 뒤에는 해당 구간이 실제 평균을 포함하든지 포함하지 않든지 둘 중 하나입니다.
오차범위란 무엇인가요?
오차범위(MOE)는 신뢰구간의 절반 폭입니다: MOE = z* × (s / √n). 선택한 신뢰수준에서 표본 평균과 실제 모집단 평균 사이의 최대 예상 차이를 나타냅니다. MOE를 줄이려면 표본 크기를 늘리거나, 표준편차를 줄이거나(데이터 변동성을 낮추거나), 더 낮은 신뢰수준을 선택하면 됩니다.
z 분포와 t 분포 중 무엇을 써야 하나요?
표본 크기가 크거나(n ≥ 30) 모집단 표준편차를 알 때는 z 분포를 사용합니다(이 계산기도 이 방식을 사용합니다). n < 30이고 모집단 표준편차를 모를 때는 t 분포를 사용하세요. t 분포는 꼬리가 더 두꺼워서 작은 표본에서 표준편차를 추정할 때의 추가 불확실성을 반영합니다.
표본 크기는 신뢰구간에 어떤 영향을 주나요?
표본 크기 n이 증가하면 표준오차(s / √n)가 감소하므로 신뢰구간이 좁아집니다. 예를 들어 표본 크기를 두 배로 늘리면 오차범위는 √2 ≈ 1.41의 비율로 줄어듭니다. 그래서 n=1000 같은 대규모 설문은 오차범위가 작고(95%에서 약 3%), n=20 정도의 파일럿 연구는 구간이 매우 넓을 수 있습니다.
데이터가 정규분포가 아니면 어떻게 하나요?
중심극한정리는 n이 커질수록 모집단 분포와 관계없이 표본 평균의 분포가 정규분포에 가까워짐을 보장합니다. n ≥ 30이면 z 기반 신뢰구간은 일반적으로 신뢰할 수 있습니다. 표본이 작고 분포가 심하게 비대칭이거나 꼬리가 두꺼우면, 부트스트랩 신뢰구간이나 t 기반 구간을 고려하세요. 둘 다 더 견고합니다.
비율의 신뢰구간도 계산할 수 있나요?
네, 하지만 공식은 다릅니다. n회 시행에서의 표본비율 p̂에 대한 Wald CI는 p̂ ± z* × √(p̂(1−p̂)/n)입니다. 이 계산기는 평균용입니다. 후보를 지지하는 유권자 비율 같은 값을 추정하려면 전용 비율 신뢰구간 도구를 사용하세요. 작은 표본이나 0 또는 1에 가까운 비율에는 Wald 공식보다 Wilson score 구간이 일반적으로 더 권장됩니다.