殘差計算器 - 線性迴歸殘差

假設檢定與統計推論

這個工具可計算簡單線性迴歸模型的殘差。輸入你的 X 與 Y 資料點,即可找出迴歸直線並分析預測誤差。

殘差計算器 - 線性迴歸殘差
假設檢定與統計推論

關於殘差計算器

殘差是觀測值與統計模型預測值之間的差。就簡單線性迴歸而言,第 i 個觀測值的殘差定義為 e_i = y_i − ŷ_i,其中 y_i 是實際觀測值,而 ŷ_i 是最小平方法迴歸直線 ŷ = b₀ + b₁x 所預測的值。 普通最小平方法(OLS)會找出可使殘差平方和最小的迴歸直線(SSE = Σe_i²)。此工具使用標準公式計算斜率(b₁)與截距(b₀):b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)²,b₀ = ȳ − b₁x̄。 殘差分析是迴歸診斷中的基本步驟。擬合模型後,應檢視殘差以驗證關鍵假設:線性(殘差對 x 作圖時不應出現系統性模式)、同方差性(殘差變異應大致固定)、獨立性(殘差不應具有自相關),以及常態性(殘差應近似服從常態分布)。 殘差圖——殘差對預測值或自變數的散佈圖——是主要的診斷工具。殘差若在 0 附近隨機散佈且沒有模式,表示線性模型是合適的。U 形等系統性模式表示非線性,漏斗形表示異方差,而群聚則可能代表有影響力的觀測值或離群值。 決定係數 R² 衡量 y 的變異中有多少可由 x 解釋。R² 範圍從 0(模型無法解釋任何變異)到 1(完全擬合)。其計算式為 1 − SSE/SST,其中 SST = Σ(yᵢ − ȳ)²。 這個計算器非常適合學習迴歸的學生、需要快速做資料品質檢查的分析師,以及在進一步進行更複雜建模前驗證模型配適度的研究人員。結果包含完整迴歸方程式、逐點殘差表、總 SSE 與 R² 值,方便立即解讀。

殘差計算範例

這些範例示範如何由 X 與 Y 資料對計算殘差。

X → Y 資料迴歸直線
X: 1,2,3,4,5 / Y: 2,4,5,4,5ŷ = 0.6x + 2.2R² = 0.60
X: 1,2,3,4 / Y: 2,4,6,8ŷ = 2x + 0R² = 1.00(完全擬合)
X: 1,2,3,4,5 / Y: 5,3,4,2,1ŷ = -0.9x + 5.7R² = 0.81

如何使用這個計算器

  1. 在第一個文字區域輸入自變數(X)值,以逗號或空格分隔。
  2. 在第二個文字區域輸入對應的觀測(Y)值,順序需與 X 相同。
  3. 點擊「計算」以配適最小平方法迴歸直線並計算所有殘差。
  4. 檢視殘差表,找出遠離迴歸直線的觀測值。
  5. 查看 R² 以評估線性模型對資料的配適程度。

常見問題

殘差很大代表什麼?
較大的殘差表示觀測值與回歸模型預測值差距很大。大殘差可能代表離群值、具影響力的觀測,或線性模型並不是資料的最佳配適。在下結論前,應先檢查這些點。
為什麼 OLS 回歸中的殘差總和為零?
當 OLS 回歸包含截距項時,殘差總和一定會恰好等於零。這是最小平方法估計量的數學性質:迴歸直線必須通過點(x̄,ȳ),因此正負偏差會互相抵銷。
殘差和誤差有什麼不同?
誤差是觀測值與真實母體迴歸直線之間無法直接觀察的差;殘差是觀測值與估計迴歸直線之間可觀察的差。實務上,殘差用來估計與分析誤差。
R² 對殘差有什麼幫助?
R²(決定係數)是線性迴歸模型所解釋的 Y 總變異比例。R² 越高,表示模型配適越好,而殘差相對於 Y 的總變異也越小。不過,單靠高 R² 並不能保證模型假設都成立。
如何在殘差中偵測異方差性?
將殘差對擬合值作圖。如果殘差的散布隨擬合值系統性增加或減少(漏斗形),就表示存在異方差性。也可以透過 Breusch-Pagan 或 White 檢定進行統計確認。
這個計算器可以處理多元線性迴歸嗎?
不可以。此計算器僅處理只有一個自變數(X)和一個應變數(Y)的簡單線性迴歸。若要進行包含兩個或更多預測變數的多元迴歸,請使用 R、Python(statsmodels)、Excel 或 SPSS 等統計軟體。