Calculateur de nuage de points - Corrélation et régression linéaire

Calculez le coefficient de corrélation (r), R² et la droite d'ajustement pour n'importe quels deux ensembles de données — statistiques instantanées du nuage de points.

Saisissez des valeurs X et Y séparées par des virgules pour calculer la régression linéaire, le coefficient de corrélation de Pearson et les principales statistiques descriptives.

Calculateur de nuage de points - Corrélation et régression linéaire
Calculez le coefficient de corrélation (r), R² et la droite d'ajustement pour n'importe quels deux ensembles de données — statistiques instantanées du nuage de points.

À propos du calculateur de nuage de points

Un nuage de points est un type de visualisation de données qui affiche deux variables numériques sous forme de points sur un plan cartésien. Chaque point représente une observation : sa position horizontale correspond à la valeur X et sa position verticale à la valeur Y. En examinant la répartition des points, on peut déterminer s'il existe une relation entre les deux variables, quelle est sa force et si elle est linéaire ou non linéaire. Ce calculateur de nuage de points calcule trois groupes de statistiques. Le premier est descriptif : le nombre de points n, la moyenne de X (x̄) et la moyenne de Y (ȳ). Le deuxième est la droite de régression linéaire — la droite qui minimise la somme des distances verticales au carré de chaque point à la droite. Elle est décrite par l'équation y = mx + b, où m est la pente et b l'ordonnée à l'origine. La pente m est calculée comme Σ[(xᵢ − x̄)(yᵢ − ȳ)] / Σ[(xᵢ − x̄)²], et l'ordonnée à l'origine b = ȳ − m·x̄. Le troisième groupe concerne les statistiques de corrélation. Le coefficient de corrélation de Pearson r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² · Σ(yᵢ − ȳ)²] mesure la force et la direction de la relation linéaire entre X et Y. Il varie de −1 à +1. Une valeur proche de +1 indique une forte relation positive (quand X augmente, Y augmente), proche de −1 une forte relation négative, et proche de 0 une relation linéaire faible ou inexistante. R² (le coefficient de détermination) est égal à r² et représente la proportion de la variance de Y expliquée par la régression linéaire sur X. Un R² de 0.90, par exemple, signifie que 90% de la variabilité de Y est expliquée par la relation linéaire avec X. Les usages courants incluent l'économie (relier le prix à la demande), la biologie (étudier la relation entre taille et poids), l'éducation (corréler le temps d'étude aux résultats des tests), l'ingénierie (prédire une sortie à partir de variables d'entrée) et l'analyse commerciale (relier les dépenses publicitaires aux ventes). Lors de l'interprétation des résultats, rappelez-vous que corrélation n'implique pas causalité. Un r élevé signifie seulement que les deux variables évoluent ensemble de manière linéaire ; il ne dit rien sur la cause. De plus, la régression linéaire suppose que la relation est réellement linéaire. Si le nuage de points suggère une courbe, un modèle linéaire sera mal adapté, quel que soit le nombre de points fournis. Vérifiez toujours les résidus ou superposez les données à la droite pour valider le modèle.

Exemples du calculateur de nuage de points

Trois jeux de données représentatifs avec coefficients de corrélation et droites de régression calculés.

Valeurs X, valeurs YRésultats clésInterprétation
X: 1,2,3,4,5 — Y: 2,4,5,4,5m≈0.7, b≈2.0, r≈0.8165, R²≈0.6667Relation linéaire positive modérée. 67% de la variance de Y est expliquée par X.
X: 1,2,3,4,5 — Y: 5,4,3,2,1m=−1, b=6, r=−1, R²=1Relation linéaire négative parfaite. Chaque augmentation de 1 unité de X réduit Y exactement de 1.
X: 2,4,6,8,10 — Y: 3,7,8,13,15m≈1.5, b≈−0.2, r≈0.9918, R²≈0.9837Relation positive très forte. La droite y = 1.5x − 0.2 explique 98.4% de la variation de Y.

Comment utiliser le calculateur de nuage de points

  1. Saisissez vos données X sous forme de nombres séparés par des virgules dans le champ 'Valeurs de l'axe X' — par exemple : 1, 2, 3, 4, 5.
  2. Saisissez les données Y correspondantes dans le champ 'Valeurs de l'axe Y'. Le nombre de valeurs doit correspondre au champ X.
  3. Cliquez sur Calculer. L'outil calcule la pente m, l'ordonnée à l'origine b, le coefficient de corrélation r et R².
  4. Lisez l'équation de régression y = mx + b pour prédire Y pour toute nouvelle valeur de X.
  5. Interprétez r : des valeurs proches de ±1 indiquent des relations linéaires fortes ; des valeurs proches de 0 suggèrent une corrélation linéaire faible ou nulle.

FAQ du calculateur de nuage de points

Qu'est-ce que le coefficient de corrélation de Pearson r ?
Le coefficient de corrélation de Pearson r mesure la force et la direction de la relation linéaire entre deux variables. Il va de −1 (corrélation linéaire négative parfaite) à +1 (corrélation linéaire positive parfaite). Une valeur de 0 signifie qu'il n'existe pas de relation linéaire, même s'il peut y avoir une relation non linéaire.
Qu'est-ce que R² et comment l'interpréter ?
R² (le coefficient de détermination) est égal à r² et indique quelle proportion de la variance de Y est expliquée par la régression linéaire sur X. Un R² de 0.85 signifie que 85% de la dispersion des valeurs de Y est expliquée par le modèle linéaire. Les 15% restants sont attribués à d'autres facteurs ou à une variation aléatoire.
Que signifie la pente de la droite de régression ?
La pente m dans y = mx + b représente le changement moyen de Y pour chaque augmentation d'une unité de X. Une pente de 2 signifie que Y augmente en moyenne de 2 unités pour chaque augmentation de 1 unité de X. Une pente négative signifie que Y diminue lorsque X augmente.
La corrélation implique-t-elle une causalité ?
Non. Un coefficient de corrélation élevé indique seulement que deux variables évoluent ensemble de manière linéaire, sans expliquer pourquoi. L'une peut provoquer l'autre, les deux peuvent dépendre d'une troisième variable (facteur de confusion), ou la corrélation peut être fortuite. Établir une causalité nécessite des expériences contrôlées ou des méthodes d'inférence causale.
Combien de points de données faut-il pour une régression linéaire ?
Il faut au moins 2 points pour ajuster une droite, mais cela donne toujours r = ±1 par définition et n'apporte aucune information utile sur la relation réelle. En pratique, il faut au moins 10–20 points pour qu'une régression soit significative, et plus vous avez de données, plus vos estimations de m, b et r sont fiables.
Que faire si mon coefficient de corrélation est proche de zéro ?
Une valeur proche de zéro signifie qu'il existe peu ou pas de relation linéaire entre X et Y. Cela ne veut toutefois pas dire que les variables ne sont pas liées : elles peuvent avoir une relation non linéaire forte, par exemple quadratique ou sinusoïdale. Pensez à tracer vos données pour vérifier l'existence de motifs non linéaires avant de conclure qu'elles sont indépendantes.