質的変動指数(IQV)計算機
質的変動指数を使ってカテゴリデータの多様性を測定します。カテゴリの度数を入力すると、0(変動なし)から 1(最大変動)までの IQV を計算できます。
各カテゴリの度数をカンマ区切りで入力し、計算をクリックすると、IQV と関連する散らばりの指標が表示されます。
質的変動指数(IQV)計算機
質的変動指数を使ってカテゴリデータの多様性を測定します。カテゴリの度数を入力すると、0(変動なし)から 1(最大変動)までの IQV を計算できます。
各カテゴリのカンマ区切りの件数を入力します。例: 48, 35, 12, 5
質的変動指数計算機について
質的変動指数(IQV)は、名義(カテゴリ)データの多様性または散らばりを表す統計指標です。名義データとは、政治的所属、人種、宗教、話す言語、目の色のように、名前の付いたカテゴリに分類されるものの、固有の数値的順序を持たないデータです。名義カテゴリは引き算したり順位付けしたりできないため、分散や標準偏差のような従来の散らばりの尺度は適用できません。IQV は、観測がカテゴリ間でどれだけ均等に分布しているかを測定し、0 から 1 までの単一の値として示すことで、この不足を補います。
IQV が 0 であるとは、まったく変動がないことを意味します。すべての観測が同じカテゴリに入っています。IQV が 1 であるとは、変動が最大であることを意味します。すべてのカテゴリの度数が完全に同じです。その中間では、分布が均等になるほど IQV は高くなります。4 つのカテゴリを持つデータセットで 1 つのカテゴリが観測の 90% を占める場合、IQV は 0 に近くなります。一方、4 つのカテゴリがそれぞれおよそ 25% を占める場合、IQV は 1 に近づきます。
式は次のとおりです: IQV = [K / (K − 1)] × [1 − Σpᵢ²]。ここで K はカテゴリ数、pᵢ はカテゴリ i に含まれる観測の割合です。Σpᵢ² はハーフィンダール・ハーシュマン指数(割合の二乗和でもあります)で、すべての割合が等しいときに最小(各 1/K なので K × (1/K)² = 1/K)となり、すべての観測が 1 つのカテゴリにあるときに最大(1)となります。K/(K−1) を掛けることで結果を再スケーリングし、カテゴリ数にかかわらず完全な均等性が常に IQV = 1 になるようにします。
IQV はペアの考え方からも導けます。すべての可能な観測ペアのうち、異なるカテゴリから選ばれる割合はどれだけでしょうか。分子は異カテゴリペアの数(観測ペア)で、分母は最大可能な異カテゴリペアの数です。これは観測ができるだけ均等に分布しているときに生じます。このペア数による導出は割合の式と同じ値を与え、直感的な理解にも役立ちます。つまり IQV は「ランダムな観測ペア全体のうち、異なる集団に属する 2 人で構成される割合はどれくらいか」という問いに答えます。
社会科学では、IQV は人口の人種・民族的多様性、宗教的異質性、政党の分裂度、国の言語多様性を測るために広く使われています。生態学では、同等の尺度としてシンプソンの多様度指数が使われます。市場調査では、市場シェアの集中または分散を評価するために使われます。これらすべての用途で、IQV は簡潔で標準化され、解釈しやすい単一の数値を提供し、規模やカテゴリ数の異なる母集団間で比較できるため、単なる生のカテゴリ件数よりもはるかに有用です。
IQV の例
度数分布によって IQV がどのように変化するかを示す 4 つのシナリオです。
| 度数 | IQV | 解釈 |
|---|---|---|
| 25, 25, 25, 25(4 つの等しいカテゴリ) | IQV = 1.0000 | 完全な最大変動です。各カテゴリが観測のちょうど 25% を占め、完全に均等です。 |
| 100, 0(1 つの支配的カテゴリ) | IQV = 0.0000 | 変動はありません。すべての観測が 1 つのカテゴリに入り、2 番目のカテゴリは空です。 |
| 48, 35, 12, 5(社会科学調査) | IQV ≈ 0.8403 | 中程度から高い変動です。典型的な 4 択調査回答の分布です。 |
| 80, 20(2 カテゴリ、偏りあり) | IQV = 0.6400 | 2 カテゴリだけの場合、IQV = 4×p×(1−p) = 4×0.8×0.2 = 0.64 です。中程度の変動です。 |
IQV 計算機の使い方
- 各カテゴリに含まれる観測数を数えます。たとえば、48 人が選択肢 A、35 人が選択肢 B、12 人が選択肢 C、5 人が選択肢 D を選んだ場合、度数は 48, 35, 12, 5 です。
- それらの度数を入力欄にカンマ区切りで入力します。順序は関係ありません。IQV は度数の値だけに依存し、カテゴリの並び順には依存しません。
- 計算をクリックします。ツールは IQV(0 から 1)、総観測数 N、カテゴリ数 K、観測された異カテゴリペアと可能な異カテゴリペアを表示します。
- IQV を解釈します。0 に近い値は、ほとんどの観測が 1 つのカテゴリに集中していること(低い多様性)を示し、1 に近い値は、観測がすべてのカテゴリにほぼ均等に分散していること(高い多様性)を示します。
- 例ボタンで事前設定されたデータセットを読み込み、自分のデータを入力する前に指数の理解を確認します。
IQV よくある質問
IQV が 0.75 とはどういう意味ですか?
IQV が 0.75 であるとは、ランダムに選ばれるすべての可能な観測ペアの 75% が、異なるカテゴリの 2 人で構成されることを意味します。これはやや高い多様性を示し、データは単一カテゴリに集中していませんが、完全に均等に分布しているわけでもありません。IQV が 1 に近いほど、カテゴリはより均等に分布しています。
IQV を順序データや数値データに使えますか?
IQV は、カテゴリに意味のある順序や距離がない名義(カテゴリ)データ向けに設計されています。カテゴリに順位はあるが距離が等しくない順序データ、または数値(間隔/比率)データには、順位相関、分散、標準偏差などの尺度の方が適しています。IQV を順序カテゴリに適用すると、順序情報が捨てられ、データの散らばりについて誤解を招く可能性があります。
IQV を計算するには何カテゴリ必要ですか?
少なくとも 2 つのカテゴリが必要です。1 つのカテゴリしかない場合、すべての観測が同じ集団に属し、変動は存在しないからです。IQV の式は (K−1) で割るため、K=1 は数学的に未定義です。2 つのカテゴリで頻率が p と (1−p) の場合、IQV は 4×p×(1−p) に簡略化され、p=0.5(均等分割)のとき 1.0 で最大となり、p=0 または p=1 のとき 0 になります。
IQV はシンプソンの多様度指数と同じですか?
両者は非常に密接に関連しています。シンプソンの多様度指数 D = 1 − Σpᵢ² は、ランダムに選ばれた 2 個体が異なるカテゴリに属する確率を測り、その補数の形式も 1 − Σpᵢ² に等しくなります。IQV はさらに K/(K−1) を掛けて結果を正規化し、カテゴリ数にかかわらず完全な均等性が常に正確に 1 になるようにします。この正規化がない場合、1 − Σpᵢ² の最大値は K に依存します。
カテゴリ名や順序を変えると IQV は変わりますか?
いいえ。IQV の式は頻度値(または割合)だけを使い、カテゴリ名や順序は使いません。「強く同意」を「カテゴリ 1」に変更したり、入力順を入れ替えたりしても、IQV は同じです。これは、自然な順序を持たない名義データに対する真の散らばりの尺度であることを意味します。