Spearman順位相関計算機 - 順位相関
2つのデータセット間の Spearman の順位相関係数(ρ)を計算し、正規分布を仮定せずに単調関係の強さと方向を測定します。
同じ長さの2つのデータセットを、カンマ区切りで入力してください。各データセットに順位を付け、タイを正しく処理したうえで、順位に対する Pearson 公式を使って ρ を計算します。
Spearman順位相関計算機 - 順位相関
2つのデータセット間の Spearman の順位相関係数(ρ)を計算し、正規分布を仮定せずに単調関係の強さと方向を測定します。
カンマまたはスペース区切りで数値を入力
データセット X と同じ数の値が必要です
Spearman相関計算機について
Spearman の順位相関係数は ρ(rho)または rs と表され、2つの変数間の単調関係を測るノンパラメトリックな指標です。線形関係を測定し、データが正規分布であることや、間隔尺度・比率尺度で測定されていることを前提とする Pearson の相関とは異なり、Spearman の係数はデータ値の順位に基づいて計算されます。そのため、順序データ、外れ値を含むデータ、そして関係が単調だが必ずしも線形ではない場合に適しています。
計算は3段階で行います。まず、各データセットに順位を付けます。最小値は 1、2番目に小さい値は 2、というように続きます。タイがある場合は、各タイ値に本来占めるはずだった順位の平均を割り当てます。次に、各観測ペアについて順位の差 dᵢ を求めます。最後に ρ を計算します。タイがないデータでは、古典的な式 ρ = 1 − (6 Σdᵢ²) / (n(n²−1)) で正確な値が得られます。タイがあるデータでは、この計算機はより一般的な式、つまり順位上で計算した Pearson 相関を用い、構造上タイを正しく処理します。
係数の範囲は −1 から +1 です。+1 は完全な正の単調関係を意味し、一方の変数が増えるたびに他方も増えます。−1 は完全な負の単調関係を意味し、一方が増えるたびに他方は減ります。0 は単調関係がないことを示します。実務上は、±0.7 を超えると強い、±0.5〜±0.7 は中程度、±0.3〜±0.5 は弱い、±0.3 未満はほぼ無視できるとされますが、「有意」とみなす閾値は常に標本サイズと文脈に依存します。
Spearman の相関は、心理学(嗜好や態度の順位付け)、教育(クラス順位とテスト点の比較)、医学(症状重症度スコアの比較)、生態学(個体数と生息地の質)、金融(リスク調整後リターンによる投資信託の順位付け)、市場調査(消費者の嗜好順位)などで広く使われます。順位付け、順序、または非正規データを扱うあらゆる分野で役立ちます。
重要な制限として、Spearman の ρ が検出できるのは単調関係のみです。関係が U 字型などの非単調である場合、強い関係があっても ρ は 0 に近くなることがあります。そのため、数値係数を解釈する際は、散布図などの視覚的診断を必ず併用して、見落としがないか確認してください。
Spearman相関の例
相関の強さやデータ構造の違いを示す4つの実例です。
| データセット | ρ | 解釈 |
|---|---|---|
| X: 10, 20, 30, 40, 50 | Y: 2, 4, 6, 8, 10 | ρ = 1.0000 | 完全な正の単調関係です。両方の変数は常に一緒に増加します。 |
| X: 105, 120, 90, 150, 135 | Y: 4.5, 3.2, 5.0, 2.1, 2.9 | ρ = −1.0000 | 完全な負の関係です。X と Y の順位は正反対になります。 |
| X: 1, 2, 3, 4, 5 | Y: 3, 1, 5, 2, 4 | ρ = 0.3000 | 2つの順位付けの間に弱い正の単調関係があります。 |
| X: 8, 9, 10, 10, 12 | Y: 4, 6, 5, 5, 7 | ρ ≈ 0.6842 | 中程度の正の相関です。タイのある値は平均順位で処理されます。 |
Spearman相関計算機の使い方
- 最初のデータセット(X)を、カンマ区切りの数値として「データセット X」欄に入力します。
- 2つ目のデータセット(Y)を「データセット Y」欄に入力します。X とまったく同じ数の値である必要があります。
- 「計算」をクリックします。計算機は両方のデータセットに順位を付け、タイがあれば平均順位を割り当て、順位に対する Pearson 公式で ρ を計算します。
- 結果パネルで ρ の値、標本数、強さの解釈を確認します。
- 例のボタンを使って、あらかじめ用意されたデータセットを読み込み、典型的な正・負・ゼロ相関のケースを確認します。
Spearman相関 FAQ
Spearman と Pearson の相関の違いは何ですか?
Pearson の r は線形関係の強さを測定し、両変数が正規分布に従い、間隔尺度で測定されていることを前提とします。Spearman の ρ は線形に限らないあらゆる単調関係を測定し、順位データで動作するため、外れ値に強く、順序データにも使えます。正規性の前提が成り立たない、データが順序尺度である、外れ値がある場合は Spearman を使ってください。
Spearman 相関に最小サンプルサイズは必要ですか?
理論上は n ≥ 2 で式は使えますが、サンプルが非常に小さい(n < 5)と、係数は個々の値に非常に敏感で、有意性検定の検出力もかなり低くなります。信頼できる推定には少なくとも 10〜15 組の観測ペアが推奨され、正式な有意性検定には n ≥ 20 が望ましいです。
計算機はタイの値をどう扱いますか?
2つ以上の観測値が同じ場合、それぞれに本来占めるはずだった順位の平均を与えます。たとえば、3番目と4番目の値が同じなら、どちらも 3.5 位になります。その後、計算機は順位上の Pearson 公式を使います。これはタイがない場合には単純な dᵢ² 公式と代数的に等価で、タイがある場合も正しく処理できます。
Spearman の ρ が 0 とはどういう意味ですか?
ρ がちょうど 0 というのは、X と Y の順位付けの間に単調関係がないことを意味します。これは変数が独立であることを意味しません。非単調な関係(たとえば U 字型)でも ρ は 0 に近くなります。パターンを見落とさないよう、必ずデータを係数と一緒にプロットしてください。
Spearman 相関はカテゴリデータに使えますか?
Spearman 相関には少なくとも順序データが必要です。つまり、意味のある順序付けができるデータです。色、名前、ラベルのような名義カテゴリデータには使えません。名義データには Cramér's V などの別の関連指標を検討してください。