定性变异指数(IQV)计算器

使用定性变异指数衡量分类数据的多样性。输入各类别频数,计算从 0(无变异)到 1(最大变异)的 IQV。

输入每个类别的频数并用逗号分隔,然后点击计算,即可得到 IQV 及相关离散度指标。

定性变异指数(IQV)计算器
使用定性变异指数衡量分类数据的多样性。输入各类别频数,计算从 0(无变异)到 1(最大变异)的 IQV。

输入每个类别的逗号分隔计数,例如 48, 35, 12, 5

关于定性变异指数计算器

定性变异指数(IQV)是用于名义(分类)数据的多样性或离散度统计量。这类数据属于有名称的类别,本身没有数值顺序,例如政治倾向、种族、宗教、使用语言或眼睛颜色。由于名义类别不能相减或排序,方差、标准差等传统离散度指标并不适用。IQV 通过衡量观测在各类别之间分布得有多均匀来弥补这一空白,并给出一个介于 0 和 1 之间的数值。 IQV 为 0 表示完全没有变异:每一个观测都落在同一类别中。IQV 为 1 表示变异最大:每个类别的频数完全相同。介于两者之间时,分布越均匀,IQV 越高。若一个四类别数据集中某个类别占 90% 的观测,IQV 会接近 0;若四个类别各约占 25%,则 IQV 会接近 1。 公式为:IQV = [K / (K − 1)] × [1 − Σpᵢ²],其中 K 是类别数,pᵢ 是第 i 类中观测所占比例。Σpᵢ² 是赫芬达尔–赫希曼指数(也就是比例平方和),当所有比例相等时最小(每个为 1/K,得到 K × (1/K)² = 1/K),当所有观测都在一个类别中时最大(得到 1)。乘以 K/(K−1) 可重新缩放结果,使完全均匀时无论类别数多少 IQV 都等于 1。 IQV 也可以从配对概念推导:在所有可能的观测配对中,有多大比例来自不同类别?分子是跨类别配对数(观测配对),分母是最大可能跨类别配对数——当观测尽可能均匀分布时出现。这个配对计数推导与比例公式得到相同结果,并提供了直观理解:IQV 回答的是“所有随机观测配对中,有多少比例由来自不同群体的两个人组成?” 社会科学家广泛使用 IQV 衡量人口的种族和族裔多样性、宗教异质性、政党碎片化以及国家的语言多样性。生态学家使用一个等价指标,称为辛普森多样性指数。市场研究人员用它评估市场份额的集中或分散程度。在这些应用中,IQV 提供了一个简洁、标准化且易解释的单一数值,可在不同规模和不同类别数的人群之间比较,比单纯的原始类别计数有用得多。

IQV 示例

四种场景展示 IQV 如何随频数分布变化。

频数IQV解释
25, 25, 25, 25(四个相等类别)IQV = 1.0000完美的最大变异。每个类别正好包含 25% 的观测——完全均匀。
100, 0(一个主导类别)IQV = 0.0000无变异。所有观测都落入一个类别;第二个类别为空。
48, 35, 12, 5(社会科学调查)IQV ≈ 0.8403中高变异。典型的四选项调查回答分布。
80, 20(两个类别,偏斜)IQV = 0.6400只有两个类别时,IQV = 4×p×(1−p) = 4×0.8×0.2 = 0.64。中等变异。

如何使用 IQV 计算器

  1. 统计每个类别中的观测数量。例如,若 48 名受访者选择选项 A,35 名选择选项 B,12 名选择选项 C,5 名选择选项 D,则频数为 48, 35, 12, 5。
  2. 在输入框中用逗号分隔输入这些频数。顺序无关紧要——IQV 只取决于频数值,不取决于类别的任何排序。
  3. 点击计算。工具会显示 IQV(0 到 1)、总观测数 N、类别数 K,以及观测和可能的跨类别配对。
  4. 解读 IQV:接近 0 的值表示大多数观测集中在一个类别中(低多样性),接近 1 的值表示观测几乎均匀分布在所有类别中(高多样性)。
  5. 使用示例按钮加载预设数据集,在输入自己的数据前验证你对该指数的理解。

IQV 常见问题

IQV 为 0.75 表示什么?
IQV 为 0.75 表示在所有可能的随机观测配对中,75% 由来自不同类别的两个个体组成。它表示较高的中等多样性——数据没有集中在单一类别中,但观测也并非完全均匀分布。IQV 越接近 1,类别分布越均匀。
我可以将 IQV 用于有序或数值数据吗?
IQV 设计用于名义(分类)数据,即类别之间没有有意义的顺序或距离。对于有序数据——类别可以排序但间距不相等——或数值(区间/比率)数据,等级相关、方差或标准差等指标更合适。将 IQV 用于有序类别会丢弃排序信息,可能误导你对数据离散程度的判断。
计算 IQV 需要多少个类别?
至少需要两个类别,因为只有一个类别时,每个观测都在同一组中,不可能有变异。IQV 公式要除以 (K−1),因此 K=1 在数学上未定义。对于两个类别,频率为 p 和 (1−p) 时,IQV 可简化为 4×p×(1−p),在 p=0.5(均分)时达到 1.0,在 p=0 或 p=1 时为 0。
IQV 和辛普森多样性指数一样吗?
它们关系非常密切。辛普森多样性指数 D = 1 − Σpᵢ² 衡量随机选取两个个体属于不同类别的概率,其互补形式也等于 1 − Σpᵢ²。IQV 在此基础上再乘以 K/(K−1) 进行标准化,使完全均匀时无论类别数多少都恰好等于 1。没有这种标准化时,1 − Σpᵢ² 的最大值会依赖于 K。
如果我重命名或重新排序类别,IQV 会变化吗?
不会。IQV 公式只使用频数值(或比例),不使用类别名称或顺序。你可以把“非常同意”重命名为“类别 1”,或交换输入顺序,IQV 都完全相同。这使它成为名义数据中真正的离散度指标,因为名义数据本身不存在自然顺序。