Calculadora de resíduos - regressão linear
Testes de hipótese e inferência estatística
Esta ferramenta calcula os resíduos de um modelo de regressão linear simples. Informe seus pontos de dados X e Y para encontrar a reta de regressão e analisar os erros de previsão.
Calculadora de resíduos - regressão linear
Testes de hipótese e inferência estatística
Sobre a calculadora de resíduos
Um resíduo é a diferença entre um valor observado e o valor previsto por um modelo estatístico. No contexto da regressão linear simples, o resíduo da observação i é definido como e_i = y_i − ŷ_i, em que y_i é o valor observado real e ŷ_i é o valor previsto pela reta de regressão de mínimos quadrados ŷ = b₀ + b₁x.
O método dos mínimos quadrados ordinários (OLS) encontra a reta de regressão que minimiza a soma dos quadrados dos resíduos (SSE = Σe_i²). Esta ferramenta calcula a inclinação (b₁) e o intercepto (b₀) usando as fórmulas padrão: b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)² e b₀ = ȳ − b₁x̄.
A análise de resíduos é uma etapa fundamental no diagnóstico de regressão. Depois de ajustar um modelo, você deve examinar os resíduos para verificar pressupostos-chave: linearidade (os resíduos não devem mostrar padrão sistemático quando plotados contra x), homocedasticidade (os resíduos devem ter variância aproximadamente constante), independência (os resíduos não devem ser autocorrelacionados) e normalidade (os resíduos devem seguir uma distribuição aproximadamente normal).
Um gráfico de resíduos — um diagrama de dispersão dos resíduos versus valores previstos ou versus a variável independente — é a principal ferramenta de diagnóstico. Resíduos distribuídos aleatoriamente em torno de zero e sem padrão indicam que o modelo linear é adequado. Padrões sistemáticos como formato de U sugerem não linearidade, formatos de funil indicam heterocedasticidade, e aglomerados sugerem a presença de observações influentes ou outliers.
O coeficiente de determinação R² mede quanto da variância em y é explicado por x. O R² varia de 0 (o modelo não explica nenhuma variância) a 1 (ajuste perfeito). Ele é calculado como 1 − SSE/SST, em que SST = Σ(yᵢ − ȳ)².
Esta calculadora é ideal para estudantes que estão aprendendo regressão, analistas que fazem verificações rápidas de qualidade de dados e pesquisadores que validam o ajuste do modelo antes de seguir para modelagens mais complexas. Os resultados incluem a equação completa da regressão, uma tabela de resíduos ponto a ponto, o SSE total e o valor de R² para interpretação imediata.
Exemplos de cálculo de resíduos
Estes exemplos mostram como os resíduos são calculados a partir de pares de dados X e Y.
| Dados X → Y | Reta de regressão | R² |
|---|---|---|
| X: 1,2,3,4,5 / Y: 2,4,5,4,5 | ŷ = 0.6x + 2.2 | R² = 0.60 |
| X: 1,2,3,4 / Y: 2,4,6,8 | ŷ = 2x + 0 | R² = 1.00 (ajuste perfeito) |
| X: 1,2,3,4,5 / Y: 5,3,4,2,1 | ŷ = -0.9x + 5.7 | R² = 0.81 |
Como usar esta calculadora
- Digite os valores independentes (X) na primeira área de texto, separados por vírgulas ou espaços.
- Digite os valores observados correspondentes (Y) na segunda área de texto, na mesma ordem de X.
- Clique em 'Calcular' para ajustar a reta de mínimos quadrados e calcular todos os resíduos.
- Confira a tabela de resíduos para identificar observações distantes da reta de regressão.
- Veja o R² para avaliar o quanto o modelo linear se ajusta aos seus dados.
Perguntas frequentes
O que significa um resíduo grande?
Um resíduo grande indica que o valor observado está longe do que o modelo de regressão previu. Resíduos grandes podem indicar outliers, observações influentes ou que o modelo linear não seja o melhor ajuste para seus dados. Investigue esses pontos antes de tirar conclusões.
Por que os resíduos somam zero na regressão OLS?
Quando a regressão OLS inclui um termo de intercepto, os resíduos sempre somam exatamente zero. É uma propriedade matemática do estimador de mínimos quadrados: a reta de regressão deve passar pelo ponto (x̄, ȳ), o que faz os desvios positivos e negativos se cancelarem.
Qual é a diferença entre resíduo e erro?
Erro é a diferença não observável entre um valor observado e a verdadeira reta de regressão populacional. Resíduo é a diferença observável entre um valor observado e a reta de regressão estimada. Na prática, os resíduos são usados para estimar e analisar erros.
O que o R² me diz sobre os resíduos?
R² (coeficiente de determinação) é a proporção da variância total em Y explicada pelo modelo de regressão linear. Um R² alto significa que o modelo se ajusta bem e que os resíduos são pequenos em relação à variabilidade total de Y. Porém, um R² alto sozinho não garante que os pressupostos do modelo foram atendidos.
Como detectar heterocedasticidade nos resíduos?
Plote os resíduos contra os valores ajustados. Se a dispersão dos resíduos aumentar ou diminuir de forma sistemática com os valores ajustados (padrão de funil), há heterocedasticidade. Testes formais como Breusch-Pagan ou White podem confirmar isso estatisticamente.
Esta calculadora lida com regressão linear múltipla?
Não. Esta calculadora trata apenas regressão linear simples com uma variável independente (X) e uma dependente (Y). Para regressão múltipla com dois ou mais preditores, use software estatístico como R, Python (statsmodels), Excel ou SPSS.