Calculadora de resíduos - regressão linear

Testes de hipótese e inferência estatística

Esta ferramenta calcula os resíduos de um modelo de regressão linear simples. Informe seus pontos de dados X e Y para encontrar a reta de regressão e analisar os erros de previsão.

Calculadora de resíduos - regressão linear
Testes de hipótese e inferência estatística

Sobre a calculadora de resíduos

Um resíduo é a diferença entre um valor observado e o valor previsto por um modelo estatístico. No contexto da regressão linear simples, o resíduo da observação i é definido como e_i = y_i − ŷ_i, em que y_i é o valor observado real e ŷ_i é o valor previsto pela reta de regressão de mínimos quadrados ŷ = b₀ + b₁x. O método dos mínimos quadrados ordinários (OLS) encontra a reta de regressão que minimiza a soma dos quadrados dos resíduos (SSE = Σe_i²). Esta ferramenta calcula a inclinação (b₁) e o intercepto (b₀) usando as fórmulas padrão: b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)² e b₀ = ȳ − b₁x̄. A análise de resíduos é uma etapa fundamental no diagnóstico de regressão. Depois de ajustar um modelo, você deve examinar os resíduos para verificar pressupostos-chave: linearidade (os resíduos não devem mostrar padrão sistemático quando plotados contra x), homocedasticidade (os resíduos devem ter variância aproximadamente constante), independência (os resíduos não devem ser autocorrelacionados) e normalidade (os resíduos devem seguir uma distribuição aproximadamente normal). Um gráfico de resíduos — um diagrama de dispersão dos resíduos versus valores previstos ou versus a variável independente — é a principal ferramenta de diagnóstico. Resíduos distribuídos aleatoriamente em torno de zero e sem padrão indicam que o modelo linear é adequado. Padrões sistemáticos como formato de U sugerem não linearidade, formatos de funil indicam heterocedasticidade, e aglomerados sugerem a presença de observações influentes ou outliers. O coeficiente de determinação R² mede quanto da variância em y é explicado por x. O R² varia de 0 (o modelo não explica nenhuma variância) a 1 (ajuste perfeito). Ele é calculado como 1 − SSE/SST, em que SST = Σ(yᵢ − ȳ)². Esta calculadora é ideal para estudantes que estão aprendendo regressão, analistas que fazem verificações rápidas de qualidade de dados e pesquisadores que validam o ajuste do modelo antes de seguir para modelagens mais complexas. Os resultados incluem a equação completa da regressão, uma tabela de resíduos ponto a ponto, o SSE total e o valor de R² para interpretação imediata.

Exemplos de cálculo de resíduos

Estes exemplos mostram como os resíduos são calculados a partir de pares de dados X e Y.

Dados X → YReta de regressão
X: 1,2,3,4,5 / Y: 2,4,5,4,5ŷ = 0.6x + 2.2R² = 0.60
X: 1,2,3,4 / Y: 2,4,6,8ŷ = 2x + 0R² = 1.00 (ajuste perfeito)
X: 1,2,3,4,5 / Y: 5,3,4,2,1ŷ = -0.9x + 5.7R² = 0.81

Como usar esta calculadora

  1. Digite os valores independentes (X) na primeira área de texto, separados por vírgulas ou espaços.
  2. Digite os valores observados correspondentes (Y) na segunda área de texto, na mesma ordem de X.
  3. Clique em 'Calcular' para ajustar a reta de mínimos quadrados e calcular todos os resíduos.
  4. Confira a tabela de resíduos para identificar observações distantes da reta de regressão.
  5. Veja o R² para avaliar o quanto o modelo linear se ajusta aos seus dados.

Perguntas frequentes

O que significa um resíduo grande?
Um resíduo grande indica que o valor observado está longe do que o modelo de regressão previu. Resíduos grandes podem indicar outliers, observações influentes ou que o modelo linear não seja o melhor ajuste para seus dados. Investigue esses pontos antes de tirar conclusões.
Por que os resíduos somam zero na regressão OLS?
Quando a regressão OLS inclui um termo de intercepto, os resíduos sempre somam exatamente zero. É uma propriedade matemática do estimador de mínimos quadrados: a reta de regressão deve passar pelo ponto (x̄, ȳ), o que faz os desvios positivos e negativos se cancelarem.
Qual é a diferença entre resíduo e erro?
Erro é a diferença não observável entre um valor observado e a verdadeira reta de regressão populacional. Resíduo é a diferença observável entre um valor observado e a reta de regressão estimada. Na prática, os resíduos são usados para estimar e analisar erros.
O que o R² me diz sobre os resíduos?
R² (coeficiente de determinação) é a proporção da variância total em Y explicada pelo modelo de regressão linear. Um R² alto significa que o modelo se ajusta bem e que os resíduos são pequenos em relação à variabilidade total de Y. Porém, um R² alto sozinho não garante que os pressupostos do modelo foram atendidos.
Como detectar heterocedasticidade nos resíduos?
Plote os resíduos contra os valores ajustados. Se a dispersão dos resíduos aumentar ou diminuir de forma sistemática com os valores ajustados (padrão de funil), há heterocedasticidade. Testes formais como Breusch-Pagan ou White podem confirmar isso estatisticamente.
Esta calculadora lida com regressão linear múltipla?
Não. Esta calculadora trata apenas regressão linear simples com uma variável independente (X) e uma dependente (Y). Para regressão múltipla com dois ou mais preditores, use software estatístico como R, Python (statsmodels), Excel ou SPSS.