분산 계산기 - 표본 및 모집단 분산

어떤 데이터셋이든 분산, 표준편차, 평균, 중앙값, 최빈값, 사분위범위를 계산하세요. 표본 또는 모집단 공식을 선택할 수 있습니다.

쉼표나 공백으로 구분된 숫자를 입력하고 표본 또는 모집단을 선택하면, 완전한 통계 요약을 즉시 확인할 수 있습니다.

분산 계산기 - 표본 및 모집단 분산
어떤 데이터셋이든 분산, 표준편차, 평균, 중앙값, 최빈값, 사분위범위를 계산하세요. 표본 또는 모집단 공식을 선택할 수 있습니다.

분산 계산기 소개

분산은 각 데이터 포인트와 평균의 차이를 제곱한 값의 평균으로, 분포가 얼마나 퍼져 있는지를 나타냅니다. 분산이 0이면 모든 값이 같다는 뜻이고, 분산이 클수록 데이터가 평균 주변에 더 넓게 흩어져 있다는 의미입니다. 분산은 제곱 단위로 표현되므로 그 제곱근인 표준편차가 더 직관적인 경우가 많지만, 분산 자체는 가법성을 가지며 여러 고급 통계 기법의 기반이 되기 때문에 통계 이론에서 매우 중요합니다. 이 분산 계산기는 본질적으로 다른 두 가지 사용 사례를 구분합니다. 모집단 분산(σ²)은 제곱 편차의 합을 n, 즉 값의 총 개수로 나눕니다. 예를 들어 한 반의 모든 학생 키처럼, 데이터셋이 설명하려는 전체 모집단일 때 사용합니다. 표본 분산(s²)은 대신 n − 1로 나누며, 베셀 보정을 적용합니다. 이는 표본의 평균이 추정값이기 때문에 실제 모집단의 퍼짐을 약간 과소평가하는 점을 보정해 줍니다. 유한한 표본에서는 보정된 값이 항상 미보정 값보다 약간 큽니다. 숫자가 더 큰 집단에서 뽑은 표본이라면 표본 분산이 표준 선택입니다. 분산 외에도 이 계산기는 완전한 기술통계 요약을 제공합니다. 평균은 합계를 개수로 나눈 산술평균입니다. 중앙값은 데이터를 정렬했을 때 가운데 값이며, 짝수 개라면 가운데 두 값의 평균입니다. 이상값에 강하고, 치우친 분포에서는 평균보다 더 유용할 때가 많습니다. 최빈값은 가장 자주 나타나는 값(또는 값들)이며, 모든 숫자가 한 번씩만 나오면 최빈값이 없다고 합니다. 범위는 최댓값과 최솟값의 차이입니다. 사분위범위(IQR)는 데이터의 가운데 50%가 차지하는 폭으로, 25백분위수에서 75백분위수까지의 범위이며, 이상값을 찾는 데 특히 유용합니다. 분산과 그 관련 지표인 표준편차, IQR, 범위는 데이터 분석 전반에서 사용됩니다. 품질 엔지니어는 분산으로 생산 일관성을 점검하고 사양에서 벗어난 배치를 찾아냅니다. 투자 분석가는 포트폴리오 변동성을 측정하는 데 분산을 사용합니다. 수익률의 분산이 높을수록 자산은 더 위험합니다. 교육자들은 시험 점수가 촘촘히 모여 있는지(낮은 분산, 일관된 학급) 아니면 넓게 퍼져 있는지(높은 분산, 이해도 차이 큼)를 확인하는 데 사용합니다. 역학자들은 지역별 질병 발생 분포를 특징짓는 데 모집단 분산을 사용하고, 사회과학자들은 인구 집단 간 불평등을 비교하는 데 이를 활용합니다. 이 도구는 정수, 소수, 양수, 음수를 포함한 어떤 숫자 목록이든 처리하며, 모든 통계를 한 번에 계산합니다. 매우 크거나 작은 수는 가독성과 정확성의 균형을 위해 최대 6자리 유효숫자로 표시됩니다.

분산 계산기 예시

서로 다른 데이터 분포에서 분산이 어떻게 달라지는지 보여 주는 세 가지 예시입니다.

데이터셋분산세부 정보
표본: 85, 92, 78, 88, 95, 81, 74s² ≈ 57.24학생 7명의 시험 점수입니다. 평균 ≈ 84.71, s ≈ 7.57. 평균 주변의 퍼짐은 중간 정도입니다.
모집단: 25, 32, 28, 45, 38, 29, 33, 51σ² ≈ 70.36한 부서의 직원 8명 전체의 나이입니다. 평균 = 35.125, σ ≈ 8.39. 45와 51이라는 두 개의 이상값 때문에 분산이 더 큽니다.
표본: 250.5, 252.1, 249.8, 255.3, 254.7, 251.9, 253.2, 256.0s² ≈ 5.108일간의 주식 종가입니다. 평균 ≈ 252.94, s ≈ 2.26. 낮은 분산으로 가격이 매우 촘촘하게 모여 있습니다.

분산 계산기 사용 방법

  1. 데이터 필드에 숫자를 입력하거나 붙여넣습니다. 쉼표, 공백, 줄바꿈으로 구분할 수 있습니다.
  2. 데이터가 더 큰 모집단의 일부라면 표본을, 전체 구성원을 모두 포함한다면 모집단을 선택하세요.
  3. 계산을 클릭하면 분산, 표준편차, 평균, 중앙값, 최빈값, IQR, 범위를 계산합니다.
  4. 분산 행에서 제곱 단위의 퍼짐을, 표준편차 행에서 원래 단위의 같은 퍼짐을 확인할 수 있습니다.
  5. 초기화를 클릭해 모든 입력을 지우고 새 계산을 시작하거나, 예시를 불러와 실제 데이터셋을 확인하세요.

분산 계산기 FAQ

분산이란 무엇이며 무엇을 측정하나요?
분산은 숫자 집합이 평균 주변에서 얼마나 퍼져 있는지를 측정합니다. 각 값과 평균의 차이를 제곱한 값의 평균으로 계산됩니다. 분산이 높을수록 흩어짐이 크고, 분산이 0이면 모든 값이 같습니다.
표본 분산과 모집단 분산의 차이는 무엇인가요?
모집단 분산은 n으로 나누며, 데이터가 그룹 전체를 포함할 때 사용합니다. 표본 분산은 n − 1(베셀 보정)으로 나누며, 더 큰 모집단에서 뽑은 일부 데이터에 사용합니다. 이 보정은 실제 모집단의 퍼짐을 과소평가하지 않도록 해 줍니다.
분산은 표준편차와 어떤 관계가 있나요?
표준편차는 분산의 제곱근입니다. 분산은 제곱 단위(예: 제곱 달러, 제곱 킬로그램)로 표현되어 직접 해석하기 어렵습니다. 제곱근을 취하면 원래 단위로 돌아가므로, 대부분의 비교에서는 표준편차가 더 직관적입니다.
언제 분산을 표준편차보다 우선해서 보고하나요?
이론 연구나 ANOVA, 회귀, 포트폴리오 이론처럼 가법성이 중요한 기법에서는 분산이 선호됩니다. 독립 변수의 합의 분산은 각 분산의 합과 같기 때문입니다. 일반 대중에게 퍼짐을 설명할 때는 데이터와 같은 단위를 쓰는 표준편차가 더 적합합니다.
IQR이 높거나 낮으면 무엇을 의미하나요?
IQR은 데이터의 가운데 50%가 차지하는 범위입니다. IQR이 작으면 중심값이 촘촘하고, 크면 더 퍼져 있다는 뜻입니다. 극단적인 이상값의 영향을 무시하므로 분산과 표준편차보다 더 강건합니다.
분산이 음수가 될 수 있나요?
아니요. 분산은 제곱항의 합을 양수로 나눈 것이므로 항상 0 이상입니다. 분산이 0이면 데이터셋의 모든 값이 같습니다. 음수 결과가 보인다면 계산 오류입니다.