残差計算機 - 線形回帰残差
仮説検定と統計的推測
このツールは、単回帰モデルの残差を計算します。X と Y のデータ点を入力して、回帰直線を求め、予測誤差を分析できます。
残差計算機 - 線形回帰残差
仮説検定と統計的推測
残差計算機について
残差とは、観測値と統計モデルが予測した値との差です。単回帰では、観測 i に対する残差は e_i = y_i − ŷ_i と定義されます。ここで y_i は実際の観測値、ŷ_i は最小二乗回帰直線 ŷ = b₀ + b₁x による予測値です。
最小二乗法(OLS)は、残差平方和(SSE = Σe_i²)を最小にする回帰直線を求めます。このツールは標準的な式を使って、傾き(b₁)と切片(b₀)を計算します。b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)²、b₀ = ȳ − b₁x̄ です。
残差分析は回帰診断の基本です。モデルを当てはめた後は、重要な仮定を確認するために残差を調べます。線形性(x に対してプロットした残差に系統的なパターンがないこと)、等分散性(残差の分散がほぼ一定であること)、独立性(残差に自己相関がないこと)、正規性(残差がおおむね正規分布に従うこと)です。
残差プロット、つまり残差を予測値または独立変数に対して散布図にしたものは、主要な診断ツールです。残差が 0 の周りにランダムに散らばり、パターンが見られなければ、線形モデルは適切です。U 字型のような系統的パターンは非線形性を示し、漏斗形は不均一分散を示し、まとまりは影響の大きい観測値や外れ値の存在を示唆します。
決定係数 R² は、y の分散のうち x でどれだけ説明できるかを表します。R² は 0(まったく説明できない)から 1(完全一致)までの値を取ります。計算式は 1 − SSE/SST で、SST = Σ(yᵢ − ȳ)² です。
この計算機は、回帰を学ぶ学生、素早くデータ品質を確認したい分析担当者、より複雑なモデリングに進む前にモデル適合を検証したい研究者に最適です。結果には、回帰方程式、各点の残差表、SSE の合計、R² が含まれ、すぐに解釈できます。
残差計算の例
これらの例は、X と Y のデータ対から残差がどのように計算されるかを示します。
| X → Y データ | 回帰直線 | R² |
|---|---|---|
| X: 1,2,3,4,5 / Y: 2,4,5,4,5 | ŷ = 0.6x + 2.2 | R² = 0.60 |
| X: 1,2,3,4 / Y: 2,4,6,8 | ŷ = 2x + 0 | R² = 1.00(完全一致) |
| X: 1,2,3,4,5 / Y: 5,3,4,2,1 | ŷ = -0.9x + 5.7 | R² = 0.81 |
使い方
- 最初のテキストエリアに、独立変数(X)の値をカンマまたはスペースで区切って入力します。
- 2つ目のテキストエリアに、X と同じ順番で対応する観測値(Y)を入力します。
- 「計算」をクリックして、最小二乗回帰直線を当てはめ、すべての残差を計算します。
- 残差表を確認して、回帰直線から大きく外れた観測を見つけます。
- R² を見て、線形モデルがデータにどの程度適合しているかを評価します。
よくある質問
大きな残差は何を意味しますか?
大きな残差は、観測値が回帰モデルの予測から大きく外れていることを示します。大きな残差は、外れ値、影響力の強い観測値、または線形モデルがデータに最適でないことを示す場合があります。結論を出す前にその点を確認してください。
なぜ OLS 回帰では残差の和が 0 になるのですか?
OLS 回帰に切片が含まれる場合、残差の和は常に正確に 0 になります。これは最小二乗推定量の数学的性質で、回帰直線は点(x̄、ȳ)を通るため、正負のずれが打ち消し合います。
残差と誤差の違いは何ですか?
誤差は、観測値と真の母集団回帰直線との差という、観測できない量です。残差は、観測値と推定された回帰直線との差という、観測可能な量です。実務では残差を使って誤差を推定・分析します。
R² は残差について何を示しますか?
R²(決定係数)は、Y の全分散のうち線形回帰モデルで説明できる割合です。R² が高いほどモデルの当てはまりは良く、残差は Y の全変動に対して小さくなります。ただし、高い R² だけではモデルの仮定が満たされているとは限りません。
残差で不均一分散をどう見つけますか?
残差を当てはめ値に対してプロットします。残差の広がりが当てはめ値に応じて系統的に大きくなったり小さくなったりする(漏斗形)なら、不均一分散があります。Breusch-Pagan 検定や White 検定などの正式な検定で統計的に確認できます。
この計算機は重回帰に対応していますか?
いいえ。この計算機は、独立変数(X)1 つと従属変数(Y)1 つの単回帰のみ対応しています。2 つ以上の説明変数を使う重回帰には、R、Python(statsmodels)、Excel、SPSS などの統計ソフトを使ってください。