Calculadora de residuos - regresión lineal
Pruebas de hipótesis e inferencia estadística
Esta herramienta calcula los residuos de un modelo de regresión lineal simple. Ingresa tus puntos de datos X e Y para hallar la recta de regresión y analizar los errores de predicción.
Calculadora de residuos - regresión lineal
Pruebas de hipótesis e inferencia estadística
Acerca de la calculadora de residuos
Un residuo es la diferencia entre un valor observado y el valor predicho por un modelo estadístico. En el contexto de la regresión lineal simple, el residuo para la observación i se define como e_i = y_i − ŷ_i, donde y_i es el valor observado real y ŷ_i es el valor predicho por la recta de regresión de mínimos cuadrados ŷ = b₀ + b₁x.
El método de mínimos cuadrados ordinarios (OLS) encuentra la recta de regresión que minimiza la suma de residuos al cuadrado (SSE = Σe_i²). Esta herramienta calcula la pendiente (b₁) y la intersección (b₀) con las fórmulas estándar: b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)² y b₀ = ȳ − b₁x̄.
El análisis de residuos es un paso fundamental en el diagnóstico de regresión. Después de ajustar un modelo, conviene examinar los residuos para comprobar supuestos clave: linealidad (los residuos no deben mostrar un patrón sistemático al graficarlos contra x), homocedasticidad (los residuos deben tener varianza aproximadamente constante), independencia (los residuos no deben estar autocorrelacionados) y normalidad (los residuos deben seguir una distribución aproximadamente normal).
Un gráfico de residuos —un diagrama de dispersión de residuos frente a valores predichos o frente a la variable independiente— es la principal herramienta de diagnóstico. Residuos distribuidos aleatoriamente alrededor de cero y sin patrón indican que el modelo lineal es adecuado. Patrones sistemáticos como una forma de U sugieren no linealidad, las formas de embudo indican heterocedasticidad y los agrupamientos sugieren la presencia de observaciones influyentes o valores atípicos.
El coeficiente de determinación R² mide cuánto de la varianza en y está explicado por x. R² va de 0 (el modelo no explica ninguna varianza) a 1 (ajuste perfecto). Se calcula como 1 − SSE/SST, donde SST = Σ(yᵢ − ȳ)².
Esta calculadora es ideal para estudiantes que aprenden regresión, analistas que realizan comprobaciones rápidas de calidad de datos y investigadores que validan el ajuste del modelo antes de pasar a un modelado más complejo. Los resultados incluyen la ecuación completa de regresión, una tabla de residuos punto por punto, el SSE total y el valor de R² para una interpretación inmediata.
Ejemplos de cálculo de residuos
Estos ejemplos muestran cómo se calculan los residuos a partir de pares de datos X e Y.
| Datos X → Y | Recta de regresión | R² |
|---|---|---|
| X: 1,2,3,4,5 / Y: 2,4,5,4,5 | ŷ = 0.6x + 2.2 | R² = 0.60 |
| X: 1,2,3,4 / Y: 2,4,6,8 | ŷ = 2x + 0 | R² = 1.00 (ajuste perfecto) |
| X: 1,2,3,4,5 / Y: 5,3,4,2,1 | ŷ = -0.9x + 5.7 | R² = 0.81 |
Cómo usar esta calculadora
- Introduce los valores independientes (X) en el primer cuadro de texto, separados por comas o espacios.
- Introduce los valores observados correspondientes (Y) en el segundo cuadro de texto, en el mismo orden que X.
- Haz clic en 'Calcular' para ajustar la recta de regresión por mínimos cuadrados y calcular todos los residuos.
- Revisa la tabla de residuos para identificar observaciones alejadas de la recta de regresión.
- Consulta R² para evaluar qué tan bien se ajusta el modelo lineal a tus datos.
Preguntas frecuentes
¿Qué significa un residuo grande?
Un residuo grande indica que el valor observado está lejos de lo que predijo el modelo de regresión. Los residuos grandes pueden indicar valores atípicos, observaciones influyentes o que el modelo lineal no sea el mejor ajuste para tus datos. Investiga esos puntos antes de sacar conclusiones.
¿Por qué los residuos suman cero en la regresión OLS?
Cuando la regresión OLS incluye un término constante, los residuos siempre suman exactamente cero. Es una propiedad matemática del estimador de mínimos cuadrados: la recta de regresión debe pasar por el punto (x̄, ȳ), lo que hace que las desviaciones positivas y negativas se cancelen.
¿Cuál es la diferencia entre residuo y error?
El error es la diferencia no observable entre un valor observado y la verdadera recta de regresión poblacional. El residuo es la diferencia observable entre un valor observado y la recta de regresión estimada. En la práctica, los residuos se usan para estimar y analizar errores.
¿Qué me dice R² sobre los residuos?
R² (coeficiente de determinación) es la proporción de la varianza total en Y explicada por el modelo de regresión lineal. Un R² alto significa que el modelo se ajusta bien y que los residuos son pequeños en relación con la variabilidad total de Y. Sin embargo, un R² alto por sí solo no garantiza que se cumplan los supuestos del modelo.
¿Cómo detecto la heterocedasticidad en los residuos?
Grafica los residuos frente a los valores ajustados. Si la dispersión de los residuos aumenta o disminuye de forma sistemática con los valores ajustados (un patrón de embudo), hay heterocedasticidad. Pruebas formales como Breusch-Pagan o White pueden confirmarlo estadísticamente.
¿Esta calculadora admite regresión lineal múltiple?
No, esta calculadora solo maneja regresión lineal simple con una variable independiente (X) y una dependiente (Y). Para regresión múltiple con dos o más predictores, usa software estadístico como R, Python (statsmodels), Excel o SPSS.