残差计算器 - 线性回归残差

假设检验与统计推断

此工具用于计算简单线性回归模型的残差。输入 X 和 Y 数据点,即可求出回归直线并分析预测误差。

残差计算器 - 线性回归残差
假设检验与统计推断

关于残差计算器

残差是观测值与统计模型预测值之间的差。在简单线性回归中,第 i 个观测的残差定义为 e_i = y_i − ŷ_i,其中 y_i 是实际观测值,ŷ_i 是最小二乘回归直线 ŷ = b₀ + b₁x 给出的预测值。 普通最小二乘法(OLS)会寻找使残差平方和最小的回归直线(SSE = Σe_i²)。本工具使用标准公式计算斜率(b₁)和截距(b₀):b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)²,b₀ = ȳ − b₁x̄。 残差分析是回归诊断中的基础步骤。拟合模型后,应检查残差以验证关键假设:线性关系(将残差对 x 作图时不应出现系统性模式)、同方差性(残差方差应大致恒定)、独立性(残差不应自相关)以及正态性(残差应近似服从正态分布)。 残差图——即残差与预测值或自变量的散点图——是主要的诊断工具。若残差围绕 0 随机散布且没有明显模式,说明线性模型是合适的。U 形等系统性模式表明非线性,漏斗形表明异方差,而聚类则可能意味着存在高影响点或离群值。 判定系数 R² 衡量 y 的方差有多少由 x 解释。R² 的范围从 0(模型未解释任何方差)到 1(完全拟合)。其计算公式为 1 − SSE/SST,其中 SST = Σ(yᵢ − ȳ)²。 这款计算器非常适合学习回归的学生、进行快速数据质量检查的分析师,以及在进入更复杂建模前验证模型拟合的研究人员。结果会显示完整的回归方程、逐点残差表、SSE 总和以及 R² 值,便于立即解读。

残差计算示例

这些示例演示了如何根据 X 和 Y 数据对计算残差。

X → Y 数据回归直线
X: 1,2,3,4,5 / Y: 2,4,5,4,5ŷ = 0.6x + 2.2R² = 0.60
X: 1,2,3,4 / Y: 2,4,6,8ŷ = 2x + 0R² = 1.00(完全拟合)
X: 1,2,3,4,5 / Y: 5,3,4,2,1ŷ = -0.9x + 5.7R² = 0.81

如何使用此计算器

  1. 在第一个文本框中输入自变量(X)值,用逗号或空格分隔。
  2. 在第二个文本框中按与 X 相同的顺序输入对应的观测(Y)值。
  3. 点击“计算”,拟合最小二乘回归直线并计算所有残差。
  4. 查看残差表,找出远离回归直线的观测值。
  5. 检查 R²,评估线性模型与数据的拟合程度。

常见问题

大的残差意味着什么?
大的残差表示观测值与回归模型预测值相差很远。较大的残差可能意味着离群值、强影响观测,或者线性模型并不是数据的最佳拟合。在得出结论前,应先检查这些点。
为什么 OLS 回归中的残差和为 0?
当 OLS 回归包含截距项时,残差总和必定恰好为 0。这是最小二乘估计的数学性质:回归直线必须经过点(x̄,ȳ),从而使正负偏差相互抵消。
残差和误差有什么区别?
误差是观测值与真实总体回归直线之间不可观测的差异。残差是观测值与估计回归直线之间可观测的差异。实践中通常用残差来估计和分析误差。
R² 对残差说明了什么?
R²(判定系数)表示线性回归模型解释了 Y 总方差中的多少比例。R² 越高,说明模型拟合越好,残差相对于 Y 的总体变异也越小。不过,仅靠高 R² 并不能保证模型假设都成立。
如何检测残差中的异方差性?
将残差对拟合值作图。如果残差的离散程度会随着拟合值系统性增大或减小(呈漏斗形),就存在异方差性。Breusch-Pagan 检验或 White 检验等正式统计检验可以进一步确认。
这个计算器能处理多元线性回归吗?
不能,这个计算器只适用于一个自变量(X)和一个因变量(Y)的简单线性回归。若要处理包含两个或更多预测变量的多元回归,请使用 R、Python(statsmodels)、Excel 或 SPSS 等统计软件。