분산 계산기 - 표본 및 모집단 분산
어떤 데이터셋이든 분산, 표준편차, 평균, 중앙값, 최빈값, 사분위범위를 계산하세요. 표본 또는 모집단 공식을 선택할 수 있습니다.
쉼표나 공백으로 구분된 숫자를 입력하고 표본 또는 모집단을 선택하면, 완전한 통계 요약을 즉시 확인할 수 있습니다.
분산 계산기 - 표본 및 모집단 분산
어떤 데이터셋이든 분산, 표준편차, 평균, 중앙값, 최빈값, 사분위범위를 계산하세요. 표본 또는 모집단 공식을 선택할 수 있습니다.
분산 계산기 소개
분산은 각 데이터 포인트와 평균의 차이를 제곱한 값의 평균으로, 분포가 얼마나 퍼져 있는지를 나타냅니다. 분산이 0이면 모든 값이 같다는 뜻이고, 분산이 클수록 데이터가 평균 주변에 더 넓게 흩어져 있다는 의미입니다. 분산은 제곱 단위로 표현되므로 그 제곱근인 표준편차가 더 직관적인 경우가 많지만, 분산 자체는 가법성을 가지며 여러 고급 통계 기법의 기반이 되기 때문에 통계 이론에서 매우 중요합니다.
이 분산 계산기는 본질적으로 다른 두 가지 사용 사례를 구분합니다. 모집단 분산(σ²)은 제곱 편차의 합을 n, 즉 값의 총 개수로 나눕니다. 예를 들어 한 반의 모든 학생 키처럼, 데이터셋이 설명하려는 전체 모집단일 때 사용합니다. 표본 분산(s²)은 대신 n − 1로 나누며, 베셀 보정을 적용합니다. 이는 표본의 평균이 추정값이기 때문에 실제 모집단의 퍼짐을 약간 과소평가하는 점을 보정해 줍니다. 유한한 표본에서는 보정된 값이 항상 미보정 값보다 약간 큽니다. 숫자가 더 큰 집단에서 뽑은 표본이라면 표본 분산이 표준 선택입니다.
분산 외에도 이 계산기는 완전한 기술통계 요약을 제공합니다. 평균은 합계를 개수로 나눈 산술평균입니다. 중앙값은 데이터를 정렬했을 때 가운데 값이며, 짝수 개라면 가운데 두 값의 평균입니다. 이상값에 강하고, 치우친 분포에서는 평균보다 더 유용할 때가 많습니다. 최빈값은 가장 자주 나타나는 값(또는 값들)이며, 모든 숫자가 한 번씩만 나오면 최빈값이 없다고 합니다. 범위는 최댓값과 최솟값의 차이입니다. 사분위범위(IQR)는 데이터의 가운데 50%가 차지하는 폭으로, 25백분위수에서 75백분위수까지의 범위이며, 이상값을 찾는 데 특히 유용합니다.
분산과 그 관련 지표인 표준편차, IQR, 범위는 데이터 분석 전반에서 사용됩니다. 품질 엔지니어는 분산으로 생산 일관성을 점검하고 사양에서 벗어난 배치를 찾아냅니다. 투자 분석가는 포트폴리오 변동성을 측정하는 데 분산을 사용합니다. 수익률의 분산이 높을수록 자산은 더 위험합니다. 교육자들은 시험 점수가 촘촘히 모여 있는지(낮은 분산, 일관된 학급) 아니면 넓게 퍼져 있는지(높은 분산, 이해도 차이 큼)를 확인하는 데 사용합니다. 역학자들은 지역별 질병 발생 분포를 특징짓는 데 모집단 분산을 사용하고, 사회과학자들은 인구 집단 간 불평등을 비교하는 데 이를 활용합니다.
이 도구는 정수, 소수, 양수, 음수를 포함한 어떤 숫자 목록이든 처리하며, 모든 통계를 한 번에 계산합니다. 매우 크거나 작은 수는 가독성과 정확성의 균형을 위해 최대 6자리 유효숫자로 표시됩니다.
분산 계산기 예시
서로 다른 데이터 분포에서 분산이 어떻게 달라지는지 보여 주는 세 가지 예시입니다.
| 데이터셋 | 분산 | 세부 정보 |
|---|---|---|
| 표본: 85, 92, 78, 88, 95, 81, 74 | s² ≈ 57.24 | 학생 7명의 시험 점수입니다. 평균 ≈ 84.71, s ≈ 7.57. 평균 주변의 퍼짐은 중간 정도입니다. |
| 모집단: 25, 32, 28, 45, 38, 29, 33, 51 | σ² ≈ 70.36 | 한 부서의 직원 8명 전체의 나이입니다. 평균 = 35.125, σ ≈ 8.39. 45와 51이라는 두 개의 이상값 때문에 분산이 더 큽니다. |
| 표본: 250.5, 252.1, 249.8, 255.3, 254.7, 251.9, 253.2, 256.0 | s² ≈ 5.10 | 8일간의 주식 종가입니다. 평균 ≈ 252.94, s ≈ 2.26. 낮은 분산으로 가격이 매우 촘촘하게 모여 있습니다. |
분산 계산기 사용 방법
- 데이터 필드에 숫자를 입력하거나 붙여넣습니다. 쉼표, 공백, 줄바꿈으로 구분할 수 있습니다.
- 데이터가 더 큰 모집단의 일부라면 표본을, 전체 구성원을 모두 포함한다면 모집단을 선택하세요.
- 계산을 클릭하면 분산, 표준편차, 평균, 중앙값, 최빈값, IQR, 범위를 계산합니다.
- 분산 행에서 제곱 단위의 퍼짐을, 표준편차 행에서 원래 단위의 같은 퍼짐을 확인할 수 있습니다.
- 초기화를 클릭해 모든 입력을 지우고 새 계산을 시작하거나, 예시를 불러와 실제 데이터셋을 확인하세요.
분산 계산기 FAQ
분산이란 무엇이며 무엇을 측정하나요?
분산은 숫자 집합이 평균 주변에서 얼마나 퍼져 있는지를 측정합니다. 각 값과 평균의 차이를 제곱한 값의 평균으로 계산됩니다. 분산이 높을수록 흩어짐이 크고, 분산이 0이면 모든 값이 같습니다.
표본 분산과 모집단 분산의 차이는 무엇인가요?
모집단 분산은 n으로 나누며, 데이터가 그룹 전체를 포함할 때 사용합니다. 표본 분산은 n − 1(베셀 보정)으로 나누며, 더 큰 모집단에서 뽑은 일부 데이터에 사용합니다. 이 보정은 실제 모집단의 퍼짐을 과소평가하지 않도록 해 줍니다.
분산은 표준편차와 어떤 관계가 있나요?
표준편차는 분산의 제곱근입니다. 분산은 제곱 단위(예: 제곱 달러, 제곱 킬로그램)로 표현되어 직접 해석하기 어렵습니다. 제곱근을 취하면 원래 단위로 돌아가므로, 대부분의 비교에서는 표준편차가 더 직관적입니다.
언제 분산을 표준편차보다 우선해서 보고하나요?
이론 연구나 ANOVA, 회귀, 포트폴리오 이론처럼 가법성이 중요한 기법에서는 분산이 선호됩니다. 독립 변수의 합의 분산은 각 분산의 합과 같기 때문입니다. 일반 대중에게 퍼짐을 설명할 때는 데이터와 같은 단위를 쓰는 표준편차가 더 적합합니다.
IQR이 높거나 낮으면 무엇을 의미하나요?
IQR은 데이터의 가운데 50%가 차지하는 범위입니다. IQR이 작으면 중심값이 촘촘하고, 크면 더 퍼져 있다는 뜻입니다. 극단적인 이상값의 영향을 무시하므로 분산과 표준편차보다 더 강건합니다.
분산이 음수가 될 수 있나요?
아니요. 분산은 제곱항의 합을 양수로 나눈 것이므로 항상 0 이상입니다. 분산이 0이면 데이터셋의 모든 값이 같습니다. 음수 결과가 보인다면 계산 오류입니다.