Wilcoxon Rank Sum Test Calculator (Mann-Whitney U)
Comparez deux échantillons indépendants avec le test non paramétrique de Wilcoxon somme des rangs (Mann-Whitney U). Obtenez U, Z et la p-value sans supposer la normalité.
Saisissez vos deux échantillons indépendants sous forme de nombres séparés par des virgules, choisissez un niveau de signification et le type de queue, puis cliquez sur Calculer.
Wilcoxon Rank Sum Test Calculator (Mann-Whitney U)
Comparez deux échantillons indépendants avec le test non paramétrique de Wilcoxon somme des rangs (Mann-Whitney U). Obtenez U, Z et la p-value sans supposer la normalité.
À propos du test de Wilcoxon somme des rangs
Le test de Wilcoxon somme des rangs, aussi appelé test U de Mann-Whitney, est un test statistique d'hypothèse non paramétrique utilisé pour déterminer si deux échantillons indépendants proviennent de populations ayant la même distribution. Contrairement au test t pour échantillons indépendants, il ne suppose pas que les données suivent une distribution normale, ce qui en fait une alternative puissante pour les données ordinales, les distributions asymétriques ou les petits échantillons où la normalité ne peut pas être établie.
Le test a été proposé à l'origine par Frank Wilcoxon en 1945, puis étendu par Mann et Whitney en 1947 sous la forme la plus couramment utilisée aujourd'hui. La statistique U de Mann-Whitney compte le nombre de fois où une valeur d'un groupe dépasse une valeur de l'autre groupe. Un U élevé pour un échantillon par rapport à l'autre fournit une preuve que les médianes ou les tendances centrales des deux populations diffèrent.
Le calcul commence par combiner les deux échantillons et classer toutes les observations de la plus petite à la plus grande. Les valeurs ex æquo reçoivent la moyenne des rangs qu'elles occuperaient autrement. On calcule ensuite séparément la somme des rangs pour chaque groupe ; les statistiques U sont ensuite déduites de ces sommes de rangs. Pour les échantillons plus grands, la distribution de U est bien approximée par une loi normale, et un score Z est utilisé pour obtenir la p-value.
L'hypothèse nulle stipule que les deux populations sont identiques — il n'existe aucune différence systématique dans leurs distributions. L'hypothèse alternative peut être bilatérale (toute différence), unilatérale droite (le groupe 1 tend à être plus grand) ou unilatérale gauche (le groupe 1 tend à être plus petit). Le choix de la queue appropriée dépend de votre question de recherche et doit être fait avant la collecte des données afin d'éviter d'augmenter l'erreur de type I.
La p-value s'interprète par rapport au niveau de signification α choisi (généralement 0,05). Si p < α, vous rejetez l'hypothèse nulle et concluez qu'il existe une différence statistiquement significative entre les groupes. Si p ≥ α, les éléments de preuve sont insuffisants pour conclure à une différence.
Ce test est largement utilisé en médecine pour comparer les résultats des patients entre groupes traités et groupes témoins lorsque les résultats ne suivent pas forcément une loi normale. En psychologie, il peut comparer des réponses d'échelle de Likert entre groupes démographiques. En écologie, il permet de vérifier si les mesures prises sur deux sites diffèrent significativement. En éducation, il compare les notes d'étudiants enseignés selon différentes méthodes.
Pour de meilleurs résultats, assurez-vous que les observations au sein de chaque échantillon sont indépendantes les unes des autres et que les deux échantillons sont indépendants l'un de l'autre. Le test est le plus puissant pour détecter des différences de localisation (déplacements de médiane) lorsque les distributions sous-jacentes ont des formes similaires.
Exemples pratiques
Explorez ces scénarios courants pour voir comment le test de Wilcoxon somme des rangs est appliqué.
| Entrée | Sortie | Remarque |
|---|---|---|
| S1: 7, 8, 8, 9, 10, 12 — S2: 9, 11, 12, 13, 14, 15 — α=0.05, two-tailed | U=4, Z≈−2.24, p≈0.025 | Temps de récupération d'un médicament — différence significative ; le groupe traité récupère plus vite. |
| S1: 85, 90, 78, 92, 88, 76 — S2: 72, 80, 81, 75, 68, 79 — α=0.05, right-tailed | U=6, Z≈1.92, p≈0.027 | Scores d'une méthode d'enseignement — la nouvelle méthode produit des scores significativement plus élevés. |
| S1: 120, 125, 130, 110, 115, 122, 128 — S2: 130, 135, 140, 128, 132, 138, 142 — α=0.01, left-tailed | U=2, Z≈−2.88, p≈0.002 | Rendement des cultures avec engrais — l'engrais B donne significativement plus. |
Comment utiliser le calculateur
- Saisissez les valeurs numériques de l'échantillon 1 dans le premier champ, séparées par des virgules ou des espaces.
- Saisissez les valeurs de l'échantillon indépendant 2 dans le second champ.
- Sélectionnez le niveau de signification α (0,01, 0,05 ou 0,10) en cliquant sur le bouton correspondant.
- Choisissez le type de queue : bilatéral pour toute différence, unilatéral droit si vous attendez que l'échantillon 1 soit plus grand, ou unilatéral gauche si vous attendez qu'il soit plus petit.
- Cliquez sur Calculer pour voir la statistique U, le score Z, la p-value et la décision statistique.
FAQ
Quelle est la différence entre le test de Wilcoxon somme des rangs et le test U de Mann-Whitney ?
Ce sont le même test, avec des noms et formulations différents. Wilcoxon a défini la statistique comme la somme des rangs, tandis que Mann et Whitney ont défini U comme le nombre de comparaisons par paires en faveur d'un groupe. Les deux statistiques sont linéairement liées et donnent les mêmes p-values.
Quand dois-je utiliser le test de Wilcoxon somme des rangs plutôt que le test t ?
Utilisez le test de Wilcoxon lorsque vos données sont ordinales, lorsque l'hypothèse de normalité est violée (surtout pour les petits échantillons) ou en présence de valeurs aberrantes. Pour de grands échantillons provenant de distributions approximativement normales, le test t et le test de Wilcoxon donnent des résultats similaires, mais le test t a un peu plus de puissance statistique.
Que signifie un test bilatéral par rapport à un test unilatéral ?
Un test bilatéral vérifie l'existence d'une différence entre les groupes, quelle qu'en soit la direction. Un test unilatéral droit vérifie si l'échantillon 1 tend à être plus grand que l'échantillon 2, et un test unilatéral gauche vérifie l'inverse. Décidez toujours du type de queue en fonction de votre hypothèse avant de collecter les données.
Comment le calculateur gère-t-il les valeurs ex æquo ?
Les valeurs ex æquo dans l'ensemble de données combiné reçoivent la moyenne des rangs qu'elles occuperaient. Par exemple, si deux observations sont ex æquo pour les rangs 3 et 4, elles reçoivent toutes deux 3,5. Cette correction par rang moyen garantit la validité des sommes de rangs et la précision de l'approximation Z.
De quelle taille d'échantillon ai-je besoin pour une approximation fiable du score Z ?
En général, l'approximation normale est jugée suffisante lorsque n₁ et n₂ sont tous deux d'au moins 8 à 10. Pour de très petits échantillons (n < 8), il faut utiliser la distribution exacte de U. Ce calculateur utilise l'approximation normale, donc interprétez les p-values avec prudence pour les très petits échantillons.
Puis-je utiliser ce test avec des données non numériques ou ordinales ?
Oui. Tant que vous pouvez attribuer des rangs significatifs aux observations — comme des réponses sur une échelle de Likert (1=pas du tout d'accord à 5=tout à fait d'accord) — le test de Wilcoxon somme des rangs est approprié. Il suffit de pouvoir ordonner les observations ; les distances numériques exactes ne sont pas nécessaires.