정성 변이 지수(IQV) 계산기

정성 변이 지수로 범주형 데이터의 다양성을 측정하세요. 범주 빈도를 입력하면 0(변이 없음)부터 1(최대 변이)까지의 IQV를 계산합니다.

각 범주의 빈도수를 쉼표로 구분해 입력한 뒤 계산을 클릭하면 IQV와 관련 산포 지표를 확인할 수 있습니다.

정성 변이 지수(IQV) 계산기
정성 변이 지수로 범주형 데이터의 다양성을 측정하세요. 범주 빈도를 입력하면 0(변이 없음)부터 1(최대 변이)까지의 IQV를 계산합니다.

각 범주의 개수를 쉼표로 구분해 입력하세요. 예: 48, 35, 12, 5

정성 변이 지수 계산기 소개

정성 변이 지수(IQV)는 명목(범주형) 데이터의 다양성 또는 산포를 나타내는 통계 척도입니다. 명목 데이터는 정치 성향, 인종, 종교, 사용 언어, 눈 색깔처럼 이름이 붙은 범주에 속하지만 본질적인 수치 순서가 없는 데이터입니다. 명목 범주는 서로 빼거나 순위를 매길 수 없으므로 분산이나 표준편차 같은 전통적인 산포 척도를 적용할 수 없습니다. IQV는 관측치가 범주 전반에 얼마나 고르게 분포하는지를 측정해 이 공백을 메우며, 0과 1 사이의 단일 숫자를 제공합니다. IQV가 0이면 변이가 전혀 없다는 뜻입니다. 모든 관측치가 같은 범주에 속합니다. IQV가 1이면 변이가 최대라는 뜻입니다. 모든 범주의 빈도가 정확히 같습니다. 그 사이에서는 분포가 고를수록 IQV가 높아집니다. 네 범주가 있는 데이터셋에서 한 범주가 관측치의 90%를 차지하면 IQV는 0에 가깝고, 네 범주가 각각 대략 25%를 차지하면 1에 가까워집니다. 공식은 IQV = [K / (K − 1)] × [1 − Σpᵢ²]입니다. 여기서 K는 범주 수이고 pᵢ는 i번째 범주에 속한 관측치의 비율입니다. Σpᵢ²는 허핀달–허쉬만 지수(비율 제곱합이기도 함)로, 모든 비율이 같을 때 최소가 됩니다(각각 1/K이므로 K × (1/K)² = 1/K). 모든 관측치가 한 범주에 있을 때는 최대값 1이 됩니다. K/(K−1)을 곱하면 결과가 재조정되어 범주 수와 관계없이 완전한 균등성이 항상 IQV = 1이 됩니다. IQV는 쌍의 개념에서도 도출할 수 있습니다. 가능한 모든 관측치 쌍 중 서로 다른 범주에서 뽑힌 쌍의 비율은 얼마일까요? 분자는 교차 범주 쌍의 수(관측 쌍)이고, 분모는 가능한 최대 교차 범주 쌍의 수입니다. 이는 관측치가 가능한 한 고르게 분포할 때 발생합니다. 이 쌍 계산 방식은 비율 공식과 같은 값을 주며 유용한 직관을 제공합니다. IQV는 “모든 무작위 관측치 쌍 중 서로 다른 집단의 두 사람으로 이루어진 비율은 얼마인가?”라는 질문에 답합니다. 사회과학자들은 IQV를 인구의 인종 및 민족 다양성, 종교적 이질성, 정당 분열도, 국가의 언어 다양성을 측정하는 데 널리 사용합니다. 생태학자들은 심프슨 다양성 지수라는 동등한 척도를 사용합니다. 시장 조사자들은 시장 점유율의 집중 또는 분산 정도를 평가하는 데 사용합니다. 이러한 모든 응용에서 IQV는 간결하고 정규화되어 해석하기 쉬운 단일 숫자를 제공하며, 규모와 범주 수가 다른 모집단 간 비교가 가능하므로 원시 범주 개수만 보는 것보다 훨씬 유용합니다.

IQV 예시

빈도 분포에 따라 IQV가 어떻게 달라지는지 보여 주는 네 가지 시나리오입니다.

빈도IQV해석
25, 25, 25, 25(네 개의 동일한 범주)IQV = 1.0000완전한 최대 변이입니다. 각 범주가 관측치의 정확히 25%를 차지해 완전히 균등합니다.
100, 0(하나의 지배적 범주)IQV = 0.0000변이가 없습니다. 모든 관측치가 한 범주에 속하고 두 번째 범주는 비어 있습니다.
48, 35, 12, 5(사회과학 설문)IQV ≈ 0.8403중간에서 높은 수준의 변이입니다. 전형적인 네 선택지 설문 응답 분포입니다.
80, 20(두 범주, 편향)IQV = 0.6400범주가 두 개뿐이면 IQV = 4×p×(1−p) = 4×0.8×0.2 = 0.64입니다. 중간 변이입니다.

IQV 계산기 사용 방법

  1. 각 범주에 속하는 관측치 수를 세세요. 예를 들어 응답자 48명이 옵션 A, 35명이 옵션 B, 12명이 옵션 C, 5명이 옵션 D를 선택했다면 빈도는 48, 35, 12, 5입니다.
  2. 이 빈도를 입력 필드에 쉼표로 구분해 입력하세요. 순서는 중요하지 않습니다. IQV는 범주의 순서가 아니라 빈도 값에만 의존합니다.
  3. 계산을 클릭하세요. 도구는 IQV(0~1), 총 관측치 수 N, 범주 수 K, 관측된 교차 범주 쌍과 가능한 교차 범주 쌍을 표시합니다.
  4. IQV를 해석하세요. 0에 가까운 값은 대부분의 관측치가 한 범주에 모여 있음을 뜻하고(낮은 다양성), 1에 가까운 값은 관측치가 모든 범주에 거의 고르게 퍼져 있음을 뜻합니다(높은 다양성).
  5. 예시 버튼으로 미리 설정된 데이터셋을 불러와, 자신의 데이터를 입력하기 전에 지수에 대한 이해를 확인하세요.

IQV FAQ

IQV가 0.75라는 것은 무엇을 의미하나요?
IQV가 0.75라는 것은 무작위로 선택 가능한 모든 관측치 쌍의 75%가 서로 다른 범주에 속한 두 개인으로 구성된다는 뜻입니다. 이는 중간보다 높은 다양성을 나타냅니다. 데이터가 단일 범주에 집중되어 있지는 않지만 관측치가 완전히 균등하게 퍼져 있지도 않습니다. IQV가 1에 가까울수록 범주는 더 고르게 분포합니다.
IQV를 순서형 또는 수치 데이터에 사용할 수 있나요?
IQV는 범주 사이에 의미 있는 순서나 거리가 없는 명목(범주형) 데이터용으로 설계되었습니다. 범주의 순위는 정할 수 있지만 거리 간격이 같지 않은 순서형 데이터나 수치(구간/비율) 데이터에는 순위상관, 분산, 표준편차 같은 다른 척도가 더 적합합니다. IQV를 순서형 범주에 적용하면 순서 정보가 버려져 데이터의 산포를 오해할 수 있습니다.
IQV를 계산하려면 범주가 몇 개 필요하나요?
최소 두 개의 범주가 필요합니다. 범주가 하나뿐이면 모든 관측치가 같은 집단에 속하므로 변이가 있을 수 없습니다. IQV 공식은 (K−1)로 나누기 때문에 K=1은 수학적으로 정의되지 않습니다. 두 범주에서 빈도가 p와 (1−p)이면 IQV는 4×p×(1−p)로 단순화되며, p=0.5(동일 분할)일 때 1.0으로 최고이고 p=0 또는 p=1일 때 0입니다.
IQV는 심프슨 다양성 지수와 같은가요?
둘은 매우 밀접하게 관련되어 있습니다. 심프슨 다양성 지수 D = 1 − Σpᵢ²는 무작위로 선택한 두 개인이 서로 다른 범주에 속할 확률을 측정하며, 그 보완 형태도 1 − Σpᵢ²와 같습니다. IQV는 여기서 한 단계 더 나아가 K/(K−1)을 곱해 결과를 정규화하므로 범주 수와 관계없이 완전한 균등성이 항상 정확히 1이 됩니다. 이 정규화가 없으면 1 − Σpᵢ²의 최대값은 K에 따라 달라집니다.
범주 이름을 바꾸거나 순서를 바꾸면 IQV가 달라지나요?
아니요. IQV 공식은 빈도 값(또는 비율)만 사용하며 범주의 이름이나 순서는 사용하지 않습니다. '매우 동의'를 '범주 1'로 바꾸거나 입력 순서를 바꿔도 IQV는 동일합니다. 따라서 자연스러운 순서가 없는 명목 데이터에 대한 진정한 산포 척도입니다.