Calculateur de résidus - Régression linéaire

Tests d’hypothèse et inférence statistique

Cet outil calcule les résidus d’un modèle de régression linéaire simple. Saisissez vos points de données X et Y pour obtenir la droite de régression et analyser les erreurs de prédiction.

Calculateur de résidus - Régression linéaire
Tests d’hypothèse et inférence statistique

À propos du calculateur de résidus

Un résidu est la différence entre une valeur observée et la valeur prédite par un modèle statistique. Dans le cadre de la régression linéaire simple, le résidu pour l’observation i est défini par e_i = y_i − ŷ_i, où y_i est la valeur observée réelle et ŷ_i la valeur prédite par la droite de régression des moindres carrés ŷ = b₀ + b₁x. La méthode des moindres carrés ordinaires (OLS) permet de trouver la droite de régression qui minimise la somme des carrés des résidus (SSE = Σe_i²). Cet outil calcule la pente (b₁) et l’ordonnée à l’origine (b₀) à l’aide des formules standard : b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)² et b₀ = ȳ − b₁x̄. L’analyse des résidus est une étape fondamentale du diagnostic de régression. Après avoir ajusté un modèle, vous devez examiner les résidus pour vérifier les hypothèses clés : linéarité (les résidus ne doivent montrer aucun motif systématique lorsqu’ils sont tracés en fonction de x), homoscédasticité (les résidus doivent avoir une variance à peu près constante), indépendance (les résidus ne doivent pas être autocorrélés) et normalité (les résidus doivent suivre approximativement une distribution normale). Un graphique des résidus — un nuage de points des résidus par rapport aux valeurs prédites ou à la variable indépendante — est l’outil diagnostique principal. Des résidus dispersés aléatoirement autour de zéro, sans motif, indiquent que le modèle linéaire est approprié. Des motifs systématiques comme une forme en U suggèrent une non-linéarité, les formes en entonnoir indiquent une hétéroscédasticité, et des regroupements suggèrent la présence d’observations influentes ou de valeurs aberrantes. Le coefficient de détermination R² mesure la part de la variance de y expliquée par x. R² varie de 0 (le modèle n’explique aucune variance) à 1 (ajustement parfait). Il est calculé par 1 − SSE/SST, où SST = Σ(yᵢ − ȳ)². Ce calculateur est idéal pour les étudiants qui apprennent la régression, les analystes qui effectuent des vérifications rapides de la qualité des données et les chercheurs qui valident l’ajustement du modèle avant de passer à des modèles plus complexes. Les résultats incluent l’équation de régression complète, un tableau des résidus point par point, le SSE total et la valeur de R² pour une interprétation immédiate.

Exemples de calcul des résidus

Ces exemples montrent comment les résidus sont calculés à partir de paires de données X et Y.

Données X → YDroite de régression
X: 1,2,3,4,5 / Y: 2,4,5,4,5ŷ = 0.6x + 2.2R² = 0.60
X: 1,2,3,4 / Y: 2,4,6,8ŷ = 2x + 0R² = 1.00 (ajustement parfait)
X: 1,2,3,4,5 / Y: 5,3,4,2,1ŷ = -0.9x + 5.7R² = 0.81

Comment utiliser ce calculateur

  1. Saisissez les valeurs indépendantes (X) dans la première zone de texte, séparées par des virgules ou des espaces.
  2. Saisissez les valeurs observées (Y) correspondantes dans la deuxième zone, dans le même ordre que X.
  3. Cliquez sur « Calculer » pour ajuster la droite de régression des moindres carrés et calculer tous les résidus.
  4. Consultez le tableau des résidus pour repérer les observations éloignées de la droite de régression.
  5. Examinez R² pour évaluer dans quelle mesure le modèle linéaire s’ajuste à vos données.

Questions fréquentes

Que signifie un résidu important ?
Un résidu important indique que la valeur observée est loin de ce que le modèle de régression a prédit. De grands résidus peuvent signaler des valeurs aberrantes, des observations influentes ou le fait que le modèle linéaire n’est pas le meilleur ajustement pour vos données. Examinez ces points avant de tirer des conclusions.
Pourquoi les résidus somment-ils à zéro en régression OLS ?
Lorsque la régression OLS inclut un terme d’ordonnée à l’origine, les résidus somment toujours exactement à zéro. C’est une propriété mathématique de l’estimateur des moindres carrés : la droite de régression doit passer par le point (x̄, ȳ), ce qui fait que les écarts positifs et négatifs s’annulent.
Quelle est la différence entre un résidu et une erreur ?
Une erreur est la différence non observable entre une valeur observée et la vraie droite de régression de la population. Un résidu est la différence observable entre une valeur observée et la droite de régression estimée. En pratique, les résidus servent à estimer et analyser les erreurs.
Que m’indique R² à propos des résidus ?
R² (coefficient de détermination) est la proportion de la variance totale de Y expliquée par le modèle de régression linéaire. Un R² élevé signifie que le modèle s’ajuste bien aux données et que les résidus sont faibles par rapport à la variabilité totale de Y. Cependant, un R² élevé seul ne garantit pas que les hypothèses du modèle sont respectées.
Comment détecter l’hétéroscédasticité dans les résidus ?
Tracez les résidus en fonction des valeurs ajustées. Si la dispersion des résidus augmente ou diminue systématiquement avec les valeurs ajustées (forme d’entonnoir), il y a hétéroscédasticité. Des tests formels comme Breusch-Pagan ou White peuvent le confirmer statistiquement.
Ce calculateur gère-t-il la régression linéaire multiple ?
Non, ce calculateur ne gère que la régression linéaire simple avec une variable indépendante (X) et une variable dépendante (Y). Pour une régression multiple avec deux prédicteurs ou plus, utilisez un logiciel statistique comme R, Python (statsmodels), Excel ou SPSS.