Question 1

분산이란 무엇이며 무엇을 측정하나요?

Accepted Answer

분산은 숫자 집합이 평균 주변에서 얼마나 퍼져 있는지를 측정합니다. 각 값과 평균의 차이를 제곱한 값의 평균으로 계산됩니다. 분산이 높을수록 흩어짐이 크고, 분산이 0이면 모든 값이 같습니다.

Question 2

표본 분산과 모집단 분산의 차이는 무엇인가요?

Accepted Answer

모집단 분산은 n으로 나누며, 데이터가 그룹 전체를 포함할 때 사용합니다. 표본 분산은 n − 1(베셀 보정)으로 나누며, 더 큰 모집단에서 뽑은 일부 데이터에 사용합니다. 이 보정은 실제 모집단의 퍼짐을 과소평가하지 않도록 해 줍니다.

Question 3

분산은 표준편차와 어떤 관계가 있나요?

Accepted Answer

표준편차는 분산의 제곱근입니다. 분산은 제곱 단위(예: 제곱 달러, 제곱 킬로그램)로 표현되어 직접 해석하기 어렵습니다. 제곱근을 취하면 원래 단위로 돌아가므로, 대부분의 비교에서는 표준편차가 더 직관적입니다.

Question 4

언제 분산을 표준편차보다 우선해서 보고하나요?

Accepted Answer

이론 연구나 ANOVA, 회귀, 포트폴리오 이론처럼 가법성이 중요한 기법에서는 분산이 선호됩니다. 독립 변수의 합의 분산은 각 분산의 합과 같기 때문입니다. 일반 대중에게 퍼짐을 설명할 때는 데이터와 같은 단위를 쓰는 표준편차가 더 적합합니다.

Question 5

IQR이 높거나 낮으면 무엇을 의미하나요?

Accepted Answer

IQR은 데이터의 가운데 50%가 차지하는 범위입니다. IQR이 작으면 중심값이 촘촘하고, 크면 더 퍼져 있다는 뜻입니다. 극단적인 이상값의 영향을 무시하므로 분산과 표준편차보다 더 강건합니다.

Question 6

분산이 음수가 될 수 있나요?

Accepted Answer

아니요. 분산은 제곱항의 합을 양수로 나눈 것이므로 항상 0 이상입니다. 분산이 0이면 데이터셋의 모든 값이 같습니다. 음수 결과가 보인다면 계산 오류입니다.

데이터셋	분산	세부 정보
표본: 85, 92, 78, 88, 95, 81, 74	s² ≈ 57.24	학생 7명의 시험 점수입니다. 평균 ≈ 84.71, s ≈ 7.57. 평균 주변의 퍼짐은 중간 정도입니다.
모집단: 25, 32, 28, 45, 38, 29, 33, 51	σ² ≈ 70.36	한 부서의 직원 8명 전체의 나이입니다. 평균 = 35.125, σ ≈ 8.39. 45와 51이라는 두 개의 이상값 때문에 분산이 더 큽니다.
표본: 250.5, 252.1, 249.8, 255.3, 254.7, 251.9, 253.2, 256.0	s² ≈ 5.10	8일간의 주식 종가입니다. 평균 ≈ 252.94, s ≈ 2.26. 낮은 분산으로 가격이 매우 촘촘하게 모여 있습니다.

분산 계산기 - 표본 및 모집단 분산

분산 계산기 소개