散布図計算機 - 相関と線形回帰

2 つのデータ集合について、相関係数 (r)、R²、最適回帰直線を即座に算出します。

X 値と Y 値をカンマ区切りで入力すると、線形回帰、ピアソン相関係数、主要な記述統計を計算できます。

散布図計算機 - 相関と線形回帰
2 つのデータ集合について、相関係数 (r)、R²、最適回帰直線を即座に算出します。

散布図計算機について

散布図は、2 つの数値変数をデカルト平面上の点として表すデータ可視化の一種です。各点は 1 つの観測値を表し、横位置が X 値、縦位置が Y 値に対応します。点の並び方を見ることで、2 変数の関係の有無、強さ、線形か非線形かを判断できます。 この散布図計算機は 3 種類の統計量を計算します。1 つ目は記述統計で、データ点の数 n、X の平均 (x̄)、Y の平均 (ȳ) です。2 つ目は線形回帰直線で、各点から直線までの垂直距離の二乗和を最小にする直線です。式 y = mx + b で表され、m は傾き、b は y 切片です。傾き m は Σ[(xᵢ − x̄)(yᵢ − ȳ)] / Σ[(xᵢ − x̄)²]、切片 b = ȳ − m·x̄ で求めます。 3 つ目は相関統計です。ピアソン相関係数 r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² · Σ(yᵢ − ȳ)²] は、X と Y の線形関係の強さと方向を表します。値の範囲は −1 から +1 です。+1 に近いほど強い正の関係(X が増えると Y も増える)、−1 に近いほど強い負の関係、0 に近いほど線形関係がほとんどないことを示します。R²(決定係数)は r² に等しく、Y の分散のうち X の線形回帰で説明できる割合を表します。たとえば R² が 0.90 なら、Y の変動の 90% が X との線形関係で説明されるという意味です。 代表的な用途としては、経済学(価格と需要の関係)、生物学(身長と体重の関係)、教育(学習時間とテスト成績の相関)、工学(入力変数から出力を予測)、ビジネス分析(広告費と売上高の関係)などがあります。 結果を解釈する際は、相関は因果を意味しないことを忘れないでください。r が高くても、2 つの変数が線形に一緒に動くことを示すだけで、どちらかが原因であることは示しません。線形回帰は、関係が実際に線形であることも前提にしています。散布図が曲線を示すなら、点がいくつあっても線形モデルは適切に当てはまりません。残差を確認するか、データと回帰直線を重ねて描き、モデルを検証してください。

散布図計算機の例

相関係数と回帰直線を計算した、代表的な 3 つのデータセットです。

X 値、Y 値主な結果解釈
X: 1,2,3,4,5 — Y: 2,4,5,4,5m≈0.7, b≈2.0, r≈0.8165, R²≈0.6667中程度の正の線形関係。X で Y の分散の 67% を説明できます。
X: 1,2,3,4,5 — Y: 5,4,3,2,1m=−1, b=6, r=−1, R²=1完全な負の線形関係。X が 1 増えるたびに Y はちょうど 1 減少します。
X: 2,4,6,8,10 — Y: 3,7,8,13,15m≈1.5, b≈−0.2, r≈0.9918, R²≈0.9837非常に強い正の関係。直線 y = 1.5x − 0.2 で Y の変動の 98.4% を説明できます。

散布図計算機の使い方

  1. 「X 軸の値」欄に、1, 2, 3, 4, 5 のようにカンマ区切りで X データを入力します。
  2. 対応する Y データを「Y 軸の値」欄に入力します。値の個数は X と一致していなければなりません。
  3. [計算]をクリックします。ツールが回帰の傾き m、切片 b、相関係数 r、R² を計算します。
  4. 回帰式 y = mx + b を読んで、新しい X 値から Y を予測します。
  5. r を解釈します。±1 に近い値は強い線形関係を示し、0 に近い値は弱い、またはほとんどない線形相関を示します。

散布図計算機 FAQ

ピアソン相関係数 r とは何ですか?
ピアソン相関係数 r は、2 つの変数の線形関係の強さと方向を測る指標です。範囲は −1(完全な負の線形相関)から +1(完全な正の線形相関)までです。0 は線形関係がないことを意味しますが、非線形の関係が存在する可能性はあります。
R² とは何ですか?どう解釈しますか?
R²(決定係数)は r² に等しく、Y の分散のうちどれだけが X の線形回帰で説明されるかを示します。R² が 0.85 なら、Y のばらつきの 85% が線形モデルで説明され、残り 15% は他の要因やランダムな変動によると考えられます。
回帰直線の傾きは何を意味しますか?
y = mx + b の傾き m は、X が 1 単位増えるごとに Y が平均してどれだけ変化するかを表します。傾きが 2 なら、X が 1 増えるたびに Y は平均 2 増えます。負の傾きは、X が増えると Y が減ることを意味します。
相関は因果を意味しますか?
いいえ。相関係数が高くても、2 変数が線形に一緒に動くことを示すだけで、理由は示しません。一方が他方を引き起こしている場合もあれば、両方が第 3 の変数の影響を受けている場合(交絡)や、偶然の一致である場合もあります。因果を立証するには、制御実験や因果推論手法が必要です。
線形回帰には何点のデータが必要ですか?
直線を当てはめるには少なくとも 2 点必要ですが、その場合は定義上 r = ±1 となり、実際の関係について有用な情報は得られません。実務では、意味のある回帰には少なくとも 10〜20 点が必要で、データが多いほど m、b、r の推定は信頼できます。
相関係数が 0 に近い場合はどうしますか?
0 に近い値は、X と Y の間に線形関係がほとんどないことを意味します。ただし、変数が無関係という意味ではありません。二次関数や正弦波のような強い非線形関係があるかもしれません。独立と結論づける前に、データをプロットして非線形パターンを確認してください。