산포도 계산기 - 분산, 표준편차 및 IQR

어떤 수치 데이터든 범위, 분산, 표준편차, IQR, 변동계수, MAD까지 모든 산포도 지표를 계산합니다.

숫자를 쉼표로 구분해 입력하고 계산을 클릭하면 산포도와 중심 경향 통계를 즉시 확인할 수 있습니다.

산포도 계산기 - 분산, 표준편차 및 IQR
어떤 수치 데이터든 범위, 분산, 표준편차, IQR, 변동계수, MAD까지 모든 산포도 지표를 계산합니다.

산포도 계산기 소개

통계적 산포도는 데이터 집합의 값들이 얼마나 퍼져 있는지를 설명합니다. 평균, 중앙값, 최빈값 같은 중심 경향 지표가 분포의 중심이 어디인지 알려준다면, 산포도 지표는 각 데이터 점이 그 중심에서 얼마나 벗어나는지 보여줍니다. 두 데이터 집합이 같은 평균을 가져도 분포는 매우 다를 수 있으며, 바로 산포도 지표가 그 차이를 드러냅니다. 범위는 가장 단순한 산포도 지표로, 가장 큰 값과 가장 작은 값의 차이입니다. 계산과 해석이 쉽지만 두 극단값에만 의존하므로 이상치에 매우 민감하고 중간의 정보는 반영하지 않습니다. 분산은 평균에서의 제곱 편차 평균을 나타냅니다. 표본 분산은 제곱 편차의 합을 (n−1)로 나누며, 베셀 보정을 사용해 표본에서 모집단 분산의 편향 없는 추정을 제공합니다. 모집단 분산은 n으로 나누며, 데이터 집합이 관심 대상인 전체 모집단일 때만 적합합니다. 표준편차는 분산의 제곱근으로, 원래 데이터와 같은 단위를 사용합니다. 사분위 범위(IQR)는 데이터의 가운데 50%가 퍼진 정도를 나타내며 Q3 − Q1로 계산합니다. Q1은 25번째 백분위수, Q3는 75번째 백분위수입니다. 하위 25%와 상위 25%를 무시하므로 이상치에 강하고, 왜도가 있는 분포의 산포를 나타내는 데 선호됩니다. 변동계수(CV)는 표본 표준편차를 평균의 백분율로 표현한 값으로, 단위가 없는 상대 변동성 지표입니다. 서로 다른 단위나 서로 다른 규모의 데이터 집합을 비교할 수 있습니다. CV가 10%라는 뜻은 표준편차가 평균의 10%라는 의미로, 실험 간 측정 정밀도를 비교할 때 유용합니다. 중앙절대편차(MAD)는 중앙값에서의 절대 편차의 중앙값입니다. IQR보다 더 강한 이상치 저항성을 가지며, 견고한 통계와 이상 탐지에 사용됩니다. IQR과 마찬가지로 극단값에 둔감해, 꼬리가 두껍거나 왜도 있는 데이터 집합에서도 신뢰할 수 있는 산포도 지표를 제공합니다.

산포도 계산기 예시

서로 다른 산포 패턴을 보여 주는 실제 데이터 집합 3개입니다.

데이터 집합핵심 지표해석
85, 92, 78, 88, 76, 95, 89, 72평균=84.375, SD≈8.19, IQR=12.25반 학급의 시험 점수입니다. CV≈9.71%는 상대적 산포가 중간 수준임을 보여 줍니다. IQR 12.25는 가운데 50%의 학생 점수가 12점 범위에 들어 있음을 뜻합니다.
1.2, -0.5, 2.1, 0.8, -1.9, 1.5, 2.5, -0.2, 0.3, 1.7, -1.1, 2.3평균=0.725, SD≈1.40, IQR=2.075월별 주식 수익률(%). 높은 CV(>100%)는 작은 양의 평균 수익률에 비해 변동성이 상당히 크다는 뜻입니다.
502, 499, 505, 498, 501, 503, 497, 500평균=500.625, SD≈2.67, CV≈0.53%품질 관리 배치의 제품 무게(g)입니다. 매우 낮은 CV는 500 g 목표 주변에서 제조 일관성이 매우 높음을 보여 줍니다.

산포도 계산기 사용 방법

  1. 텍스트 영역에 데이터를 입력하거나 붙여넣고, 쉼표·공백·줄바꿈으로 값을 구분하세요.
  2. 계산을 클릭합니다. 계산기는 숫자를 해석하고 숫자가 아닌 토큰은 무시합니다.
  3. 중심 경향 지표(개수, 평균, 중앙값)를 확인해 데이터의 중심을 파악하세요.
  4. 산포도 지표를 확인하세요. 범위는 전체 퍼짐, 표준편차는 평균에서의 평균적 편차, IQR은 가운데 50%의 퍼짐을 보여 줍니다.
  5. 변동계수로 서로 다른 데이터 집합의 상대 변동성을 비교하고, MAD로 이상치에 강한 산포도를 확인하세요.

산포도 계산기 FAQ

언제 표준편차 대신 IQR을 써야 하나요?
데이터가 왜도 있거나 이상치를 포함하거나 정규 분포가 아닐 때는 IQR을 사용하세요. IQR은 가운데 50%만 보기 때문에 극단값의 영향을 받지 않습니다. 표준편차는 모든 값을 반영하므로 이상치 하나만으로도 크게 늘어날 수 있습니다. 이상치가 없는 정규 분포 데이터라면 두 지표 모두 유용합니다.
표본 분산과 모집단 분산의 차이는 무엇인가요?
모집단 분산은 제곱 편차의 합을 n(전체 개수)으로 나누며, 전체 모집단 데이터를 가진 경우에 적합합니다. 표본 분산은 n−1(베셀 보정)으로 나누어 표본에서 모집단 분산을 추정할 때의 편향을 보정합니다. 큰 표본에서는 차이가 거의 없지만, 작은 표본(n < 30)에서는 더 중요합니다.
변동계수는 무엇을 알려 주나요?
변동계수(CV)는 표준편차를 평균의 백분율로 나타내는 척도여서, 규모와 무관한 상대 변동성 지표를 제공합니다. CV가 5%면 비교적 안정적이고, 50%면 평균에 비해 매우 변동성이 크다는 뜻입니다. 서로 다른 단위의 측정값, 예를 들어 두 제조 공정의 일관성을 비교할 때 특히 유용합니다.
중앙절대편차(MAD)는 어떻게 계산하나요?
MAD는 중앙값에서의 절대 편차의 중앙값입니다: MAD = median(|xi − median(x)|). 편차의 평균이 아니라 중앙값을 사용하므로 표준편차보다 이상치에 강합니다. 흔히 쓰는 견고한 표준편차 추정치는 1.4826 × MAD이며, 정규 분포에서는 표준편차와 같습니다.
평균과 중앙값이 크게 달라지는 이유는 무엇인가요?
평균과 중앙값이 크게 다르면 분포가 치우쳐 있다는 뜻입니다. 평균이 중앙값보다 훨씬 크면 오른쪽 꼬리가 긴 분포로, 몇 개의 큰 값이 평균을 끌어올린 것입니다. 평균이 중앙값보다 훨씬 작으면 왼쪽 꼬리가 긴 분포입니다. 왜도 있는 분포에서는 중심 경향은 평균보다 중앙값이, 산포는 표준편차보다 IQR이 더 적합합니다.
이 계산기는 아주 큰 데이터 집합도 처리할 수 있나요?
입력할 수 있는 크기의 데이터 집합이라면 처리할 수 있지만, 매우 큰 입력은 파싱이 느릴 수 있습니다. 가장 좋은 성능을 위해서는 한 줄에 쉼표로 구분해 입력하거나 여러 줄로 나누세요. 계산은 수치적으로 안정적인 알고리즘을 사용하므로 일반적인 데이터 범위에서는 오버플로와 언더플로를 피할 수 있습니다. 수백만 개의 값을 분석한다면 R이나 Python pandas 같은 전용 통계 패키지가 더 효율적입니다.