Calculateur de corrélation de Spearman - corrélation de rang
Calculez le coefficient de corrélation de rang de Spearman (ρ) entre deux jeux de données et mesurez la force et la direction d'une relation monotone sans supposer la normalité.
Saisissez deux jeux de données de même longueur, séparés par des virgules. Le calculateur attribue des rangs à chaque jeu et calcule ρ avec la formule de Pearson appliquée aux rangs, en gérant correctement les ex æquo.
Calculateur de corrélation de Spearman - corrélation de rang
Calculez le coefficient de corrélation de rang de Spearman (ρ) entre deux jeux de données et mesurez la force et la direction d'une relation monotone sans supposer la normalité.
Saisissez des nombres séparés par des virgules ou des espaces
Doit contenir le même nombre de valeurs que le jeu X
À propos du calculateur de corrélation de Spearman
Le coefficient de corrélation de rang de Spearman, noté ρ (rho) ou rs, est une mesure non paramétrique de la relation monotone entre deux variables. Contrairement à la corrélation de Pearson, qui mesure la relation linéaire et exige que les données soient normalement distribuées et mesurées sur des échelles d'intervalle ou de rapport, le coefficient de Spearman utilise les rangs des valeurs. Il convient donc aux données ordinales, aux données contenant des valeurs aberrantes et à toute situation où la relation entre les variables est monotone sans être nécessairement linéaire.
Le calcul se déroule en trois étapes. D'abord, chaque jeu de données est classé : la plus petite valeur reçoit le rang 1, la deuxième plus petite le rang 2, et ainsi de suite. En cas d'ex æquo, chaque valeur ex æquo reçoit la moyenne des rangs qu'elle aurait autrement occupés. Ensuite, la différence dᵢ entre les rangs appariés est calculée pour chaque paire d'observations. Enfin, ρ est calculé. Pour les données sans ex æquo, la formule classique ρ = 1 − (6 Σdᵢ²) / (n(n²−1)) donne un résultat exact. Pour les données avec ex æquo, ce calculateur utilise la formule plus générale — la corrélation de Pearson calculée sur les rangs — qui gère correctement les ex æquo par construction.
Le coefficient varie de −1 à +1. Une valeur de +1 signifie une relation monotone positive parfaite : chaque augmentation d'une variable s'accompagne d'une augmentation de l'autre. Une valeur de −1 signifie une relation monotone négative parfaite : chaque augmentation d'une variable s'accompagne d'une diminution de l'autre. Une valeur de 0 indique l'absence de relation monotone. En pratique, les valeurs au-dessus de ±0.7 sont considérées comme fortes, de ±0.5 à ±0.7 comme modérées, de ±0.3 à ±0.5 comme faibles, et sous ±0.3 comme négligeables, même si le seuil de « significativité » dépend toujours de la taille de l'échantillon et du contexte.
La corrélation de Spearman est largement utilisée en psychologie (classement de préférences ou d'attitudes), en éducation (comparaison des rangs de classe aux notes de tests), en médecine (comparaison de scores de sévérité des symptômes), en écologie (abondance par rapport à la qualité de l'habitat), en finance (classement de fonds communs selon le rendement ajusté au risque) et en études de marché (classements de préférences des consommateurs). Tout domaine travaillant avec des données classées, ordonnées ou non normales peut en bénéficier.
Une limite importante : le ρ de Spearman ne détecte que les relations monotones. Si la relation est en forme de U ou autrement non monotone, ρ peut être proche de zéro même lorsqu'une relation forte existe. Dans ces cas, les nuages de points et d'autres diagnostics visuels doivent toujours accompagner le coefficient numérique afin de garantir une interprétation correcte du résultat.
Exemples de corrélation de Spearman
Quatre exemples détaillés illustrant différentes forces de corrélation et structures de données.
| Jeux de données | ρ | Interprétation |
|---|---|---|
| X: 10, 20, 30, 40, 50 | Y: 2, 4, 6, 8, 10 | ρ = 1.0000 | Relation monotone positive parfaite : les deux variables augmentent toujours ensemble. |
| X: 105, 120, 90, 150, 135 | Y: 4.5, 3.2, 5.0, 2.1, 2.9 | ρ = −1.0000 | Relation négative parfaite : X et Y sont classés exactement dans l'ordre inverse. |
| X: 1, 2, 3, 4, 5 | Y: 3, 1, 5, 2, 4 | ρ = 0.3000 | Relation monotone positive faible entre les deux ordres de rang. |
| X: 8, 9, 10, 10, 12 | Y: 4, 6, 5, 5, 7 | ρ ≈ 0.6842 | Corrélation positive modérée ; les valeurs ex æquo sont traitées en moyennant les rangs. |
Comment utiliser le calculateur de corrélation de Spearman
- Saisissez votre premier jeu de données (X) sous forme de nombres séparés par des virgules dans le champ Jeu de données X.
- Saisissez votre deuxième jeu de données (Y) dans le champ Jeu de données Y ; il doit contenir exactement le même nombre de valeurs que X.
- Cliquez sur Calculer. Le calculateur classe les deux jeux de données, gère les valeurs ex æquo en moyennant les rangs et calcule ρ avec la formule de Pearson sur les rangs.
- Lisez la valeur de ρ, la taille de l'échantillon et l'interprétation de la force dans le panneau de résultats.
- Utilisez les boutons d'exemple pour charger des jeux de données prédéfinis et voir des scénarios typiques de corrélation positive, négative et nulle.
FAQ sur la corrélation de Spearman
Quelle est la différence entre la corrélation de Spearman et celle de Pearson ?
Le r de Pearson mesure la force d'une relation linéaire et suppose que les deux variables sont normalement distribuées et mesurées sur une échelle d'intervalle. Le ρ de Spearman mesure toute relation monotone — pas seulement linéaire — et fonctionne sur des données classées, ce qui le rend robuste aux valeurs aberrantes et valide pour les données ordinales. Utilisez Spearman lorsque l'hypothèse de normalité est violée, lorsque les données sont ordinales ou lorsque des valeurs aberrantes sont présentes.
La corrélation de Spearman exige-t-elle une taille minimale d'échantillon ?
Techniquement, la formule fonctionne avec n ≥ 2, mais avec de très petits échantillons (n < 5), le coefficient est très sensible aux valeurs individuelles et les tests de significativité ont une puissance très faible. Un minimum de 10–15 observations appariées est recommandé pour une estimation fiable, et n ≥ 20 est préférable pour un test formel de significativité.
Comment le calculateur gère-t-il les valeurs ex æquo ?
Lorsque deux observations ou plus partagent la même valeur, chaque observation ex æquo reçoit la moyenne des rangs qu'elle aurait occupés. Par exemple, si les valeurs aux positions 3 et 4 sont égales, chacune reçoit le rang 3.5. Le calculateur utilise ensuite la formule de Pearson sur les rangs, algébriquement équivalente à la formule simple en dᵢ² lorsqu'il n'y a pas d'ex æquo et correcte lorsqu'ils sont présents.
Que signifie un ρ de Spearman égal à 0 ?
Un ρ exactement égal à 0 signifie qu'il n'y a pas de relation monotone entre les ordres de rang de X et Y. Cela ne signifie pas que les variables sont indépendantes : une relation non monotone, par exemple en forme de U, produirait aussi un ρ proche de 0. Tracez toujours vos données en parallèle du coefficient pour vous assurer qu'aucun motif n'est manqué.
La corrélation de Spearman peut-elle être utilisée avec des données catégorielles ?
La corrélation de Spearman exige au moins des données ordinales, c'est-à-dire des données qui peuvent être classées de manière significative. Elle ne peut pas être appliquée à des données catégorielles nominales (par exemple couleurs, noms, étiquettes), où le concept d'ordre de rang ne s'applique pas. Pour les données nominales, envisagez plutôt le V de Cramér ou d'autres mesures d'association.