残差计算器 - 线性回归残差
假设检验与统计推断
此工具用于计算简单线性回归模型的残差。输入 X 和 Y 数据点即可得到回归直线并分析预测误差。
残差计算器 - 线性回归残差
假设检验与统计推断
关于残差计算器
残差是观测值与统计模型预测值之间的差。在线性回归中,第 i 个观测的残差定义为 e_i = y_i − ŷ_i,其中 y_i 是实际观测值,ŷ_i 是最小二乘回归直线 ŷ = b₀ + b₁x 预测得到的值。
普通最小二乘法(OLS)会寻找使残差平方和最小的回归直线(SSE = Σe_i²)。本工具使用标准公式计算斜率(b₁)和截距(b₀):b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)²,b₀ = ȳ − b₁x̄。
残差分析是回归诊断中的基础步骤。拟合模型后,应检查残差以验证关键假设:线性关系(残差对 x 作图时不应出现系统性模式)、同方差性(残差方差应大致恒定)、独立性(残差不应存在自相关)以及正态性(残差应近似服从正态分布)。
残差图——残差对预测值或自变量的散点图——是最主要的诊断工具。若残差围绕 0 随机分布且无明显模式,说明线性模型是合适的。U 形等系统性模式表示非线性,漏斗形表示异方差,聚类则可能说明存在高影响点或离群值。
判定系数 R² 衡量 y 的方差中有多少可由 x 解释。R² 的范围从 0(模型无法解释任何方差)到 1(完全拟合)。其计算公式为 1 − SSE/SST,其中 SST = Σ(yᵢ − ȳ)²。
本计算器适合学习回归的学生、需要快速检查数据质量的分析师,以及在进入更复杂建模前验证模型拟合度的研究人员。结果包含完整的回归方程、逐点残差表、总 SSE 和 R² 值,便于立即解读。
残差计算示例
这些示例展示了如何根据 X 和 Y 数据对计算残差。
| X → Y 数据 | 回归直线 | R² |
|---|---|---|
| X: 1,2,3,4,5 / Y: 2,4,5,4,5 | ŷ = 0.6x + 2.2 | R² = 0.60 |
| X: 1,2,3,4 / Y: 2,4,6,8 | ŷ = 2x + 0 | R² = 1.00(完全拟合) |
| X: 1,2,3,4,5 / Y: 5,3,4,2,1 | ŷ = -0.9x + 5.7 | R² = 0.81 |
如何使用此计算器
- 在第一个文本框中输入自变量(X)值,使用逗号或空格分隔。
- 在第二个文本框中按与 X 相同的顺序输入对应的观测(Y)值。
- 点击“计算”以拟合最小二乘回归直线并计算所有残差。
- 查看残差表,找出与回归直线偏差较大的观测。
- 查看 R² 以评估线性模型对数据的拟合程度。
常见问题
残差很大意味着什么?
较大的残差表示观测值与回归模型预测值相差较远。大残差可能意味着离群值、影响点,或线性模型并非最适合你的数据。在下结论前,应先检查这些点。
为什么 OLS 回归中的残差和为零?
当 OLS 回归包含截距项时,残差总和必定恰好为零。这是最小二乘估计量的数学性质:回归直线必须经过点(x̄,ȳ),因此正负偏差会相互抵消。
残差和误差有什么区别?
误差是观测值与真实总体回归直线之间不可直接观测的差;残差是观测值与估计回归直线之间可观测的差。在实践中,残差用于估计和分析误差。
R² 对残差有什么说明?
R²(判定系数)是线性回归模型解释的 Y 总方差比例。R² 越高,说明模型拟合越好,残差相对于 Y 的总变异也越小。不过,仅凭高 R² 并不能保证模型假设都成立。
如何检测残差中的异方差性?
将残差对拟合值作图。如果残差的离散程度随拟合值系统性增大或减小(漏斗形),就说明存在异方差性。也可以用 Breusch-Pagan 或 White 检验进行统计确认。
这个计算器支持多元线性回归吗?
不支持。此计算器仅处理具有一个自变量(X)和一个因变量(Y)的简单线性回归。若要进行包含两个或更多预测变量的多元回归,请使用 R、Python(statsmodels)、Excel 或 SPSS 等统计软件。