Question 1

언제 표본 SD를 쓰고, 언제 모집단 SD를 써야 하나요?

Accepted Answer

데이터가 더 큰 모집단의 표본이고 실제 모집단 산포를 추정하려는 경우에는 표본 표준편차(s, 베셀 보정, 분모 n−1)를 사용하세요. 분석 대상 모집단의 모든 구성원이 데이터에 포함된 경우에만 모집단 표준편차(σ, 분모 n)를 사용합니다. 대부분의 연구와 비즈니스 상황에서는 표본 SD가 올바른 선택입니다.

Question 2

표준편차가 높다는 것은 무엇을 의미하나요?

Accepted Answer

표준편차가 높다는 것은 데이터 포인트가 평균 주변에 넓게 퍼져 있다는 뜻으로, 변동성이나 산포가 크다는 의미입니다. 금융에서는 높은 변동성을 뜻하고, 제조에서는 출력이 들쭉날쭉하다는 뜻이며, 교육에서는 점수 분포가 넓다는 뜻입니다. ‘높다’가 문제인지 여부는 맥락과 허용 가능한 변동 수준에 따라 달라집니다.

Question 3

변동계수(CV)란 무엇인가요?

Accepted Answer

변동계수는 표준편차를 평균의 백분율로 나타낸 값입니다: CV = (s / |x̄|) × 100%. 단위가 없는 비율이므로 서로 다른 단위나 매우 다른 규모의 데이터셋 간 변동성을 비교하는 데 유용합니다. CV가 5%면 표준편차가 평균의 5%에 불과해 매우 촘촘히 모여 있다는 뜻이고, CV가 80%면 평균에 비해 매우 흩어져 있다는 뜻입니다.

Question 4

표준편차는 이상치의 영향을 받나요?

Accepted Answer

네. 각 편차를 평균에서의 차이의 제곱으로 계산하기 때문에 극단적인 이상치는 표준편차에 과도한 영향을 줍니다. 매우 크거나 매우 작은 값 하나만으로도 SD가 크게 부풀려질 수 있습니다. 이상치가 있다면 분포를 더 완전하게 보여 주기 위해 평균과 SD와 함께 중앙값과 사분위 범위도 보고하는 것이 좋습니다.

Question 5

음수도 표준편차를 계산할 수 있나요?

Accepted Answer

네. 표준편차는 음수, 0, 그리고 양수와 음수가 섞인 값에도 올바르게 적용됩니다. 변동계수만 평균이 0이거나 0에 가까우면 정의되지 않거나 오해를 부를 수 있습니다. 아주 작은 평균으로 나누면 백분율이 임의로 매우 커지기 때문입니다.

데이터셋	표본 표준편차	맥락
85, 92, 78, 88, 90	s ≈ 5.4589	학생 5명의 시험 점수입니다. 평균 = 86.6, 모집단 표준편차 ≈ 4.8826.
150.25, 152.50, 149.75, 153.00, 151.50	s ≈ 1.3987	주간 종가입니다. 표준편차가 낮아 이 기간 가격이 안정적이었음을 보여줍니다.
502, 499, 505, 498, 501, 503	s ≈ 2.5820	제조 배치 중량(그램)입니다. CV ≈ 0.5%로 생산 허용오차가 매우 좁습니다.
250000, 275000, 260000, 280000, 265000	s ≈ 11937	동네 주택 가격입니다. SD가 $11 937로, 가격 분포가 중간 정도임을 보여줍니다.

표준편차 계산기 - 표본 및 모집단 표준편차

표준편차 계산기 소개

표준편차 예시

표준편차 계산기 사용법

표준편차 FAQ