残差計算機 - 線形回帰の残差

仮説検定と統計的推測

このツールは、単回帰モデルの残差を計算します。X と Y のデータ点を入力すると、回帰直線を求め、予測誤差を分析できます。

残差計算機 - 線形回帰の残差
仮説検定と統計的推測

残差計算機について

残差とは、観測値と統計モデルが予測した値との差です。単回帰の文脈では、観測 i の残差は e_i = y_i − ŷ_i と定義されます。ここで y_i は実際の観測値、ŷ_i は最小二乗回帰直線 ŷ = b₀ + b₁x による予測値です。 最小二乗法(OLS)は、残差平方和を最小化する回帰直線を求めます(SSE = Σe_i²)。このツールでは、標準的な式 b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)² と b₀ = ȳ − b₁x̄ を使って、傾き(b₁)と切片(b₀)を計算します。 残差分析は回帰診断の基本です。モデルを当てはめた後は、残差を確認して主要な仮定を検証します。すなわち、線形性(x に対して残差に系統的なパターンがないこと)、等分散性(残差の分散がほぼ一定であること)、独立性(残差に自己相関がないこと)、正規性(残差が概ね正規分布に従うこと)です。 残差プロット――残差を予測値または独立変数に対して描いた散布図――は、主要な診断手法です。残差が 0 の周りにランダムに散らばり、パターンが見られなければ、線形モデルは適切だと考えられます。U 字型のような系統的パターンは非線形性、漏斗形は不均一分散、クラスターは影響の大きい観測値や外れ値の存在を示します。 決定係数 R² は、y の分散のうち x で説明できる割合を表します。R² は 0(モデルが分散を全く説明しない)から 1(完全一致)までの値をとります。計算式は 1 − SSE/SST で、SST = Σ(yᵢ − ȳ)² です。 この計算機は、回帰を学ぶ学生、データ品質を手早く確認したい分析者、より複雑なモデリングに進む前に適合度を検証したい研究者に最適です。結果には、回帰式、各点の残差表、総 SSE、R² が含まれ、すぐに解釈できます。

残差計算の例

これらの例は、X と Y のデータペアから残差がどのように計算されるかを示します。

X → Y データ回帰直線
X: 1,2,3,4,5 / Y: 2,4,5,4,5ŷ = 0.6x + 2.2R² = 0.60
X: 1,2,3,4 / Y: 2,4,6,8ŷ = 2x + 0R² = 1.00(完全一致)
X: 1,2,3,4,5 / Y: 5,3,4,2,1ŷ = -0.9x + 5.7R² = 0.81

使い方

  1. 最初の入力欄に独立変数(X)の値を、カンマまたはスペースで区切って入力します。
  2. 2 つ目の入力欄に、X と同じ順序で対応する観測値(Y)を入力します。
  3. 「計算」をクリックして最小二乗回帰直線を求め、すべての残差を計算します。
  4. 残差表を確認して、回帰直線から大きく外れる観測を見つけます。
  5. R² を確認して、線形モデルがどの程度データに適合しているかを評価します。

よくある質問

残差が大きいとはどういう意味ですか?
残差が大きいということは、観測値が回帰モデルの予測値から大きく外れていることを示します。大きな残差は、外れ値、影響力のある観測、または線形モデルが最適ではないことを示す場合があります。結論を出す前に、そのような点を確認してください。
なぜ OLS 回帰では残差の和が 0 になるのですか?
OLS 回帰に切片項が含まれると、残差の和は常に正確に 0 になります。これは最小二乗推定量の数学的性質で、回帰直線は点(x̄,ȳ)を通る必要があるため、正負のずれが打ち消し合うからです。
残差と誤差の違いは何ですか?
誤差は、観測値と真の母集団回帰直線との差であり、直接は観測できません。残差は、観測値と推定回帰直線との差で、観測可能です。実務では、残差を使って誤差を推定・分析します。
R² は残差について何を示しますか?
R²(決定係数)は、線形回帰モデルで説明される Y の全分散の割合です。R² が高いほどモデルはよく当てはまり、残差は Y の全変動に比べて小さくなります。ただし、R² が高いだけではモデルの仮定が満たされているとは限りません。
残差の不均一分散はどうやって検出しますか?
残差を当てはめ値に対してプロットします。残差のばらつきが当てはめ値に応じて系統的に増減する(漏斗形)場合、不均一分散が存在します。Breusch-Pagan 検定や White 検定などの形式的検定でも確認できます。
この計算機は重回帰に対応していますか?
いいえ。この計算機は、独立変数(X)が 1 つ、従属変数(Y)が 1 つの単回帰のみを扱います。2 つ以上の説明変数を用いる重回帰には、R、Python(statsmodels)、Excel、SPSS などの統計ソフトを使用してください。