Calculateur de somme des rangs de Wilcoxon (Mann-Whitney U)

Comparez deux échantillons indépendants avec le test non paramétrique de somme des rangs de Wilcoxon (Mann-Whitney U). Obtenez la statistique U, le score Z et la valeur p sans supposer la normalité.

Saisissez vos deux échantillons indépendants sous forme de nombres séparés par des virgules, choisissez un seuil de significativité et le type de queue, puis cliquez sur Calculer.

Calculateur de somme des rangs de Wilcoxon (Mann-Whitney U)
Comparez deux échantillons indépendants avec le test non paramétrique de somme des rangs de Wilcoxon (Mann-Whitney U). Obtenez la statistique U, le score Z et la valeur p sans supposer la normalité.

À propos du test de somme des rangs de Wilcoxon

Le test de somme des rangs de Wilcoxon, aussi appelé test U de Mann-Whitney, est un test d’hypothèse statistique non paramétrique utilisé pour déterminer si deux échantillons indépendants proviennent de populations ayant la même distribution. Contrairement au test t pour échantillons indépendants, il ne suppose pas que les données suivent une distribution normale, ce qui en fait une alternative puissante pour des données ordinales, des distributions asymétriques ou de petits échantillons où la normalité ne peut pas être établie. Le test a été proposé à l’origine par Frank Wilcoxon en 1945, puis étendu par Mann et Whitney en 1947 sous la forme la plus couramment utilisée aujourd’hui. La statistique U de Mann-Whitney compte le nombre de fois où une valeur d’un groupe dépasse une valeur de l’autre groupe. Un U élevé pour un échantillon par rapport à l’autre fournit une preuve que les médianes ou les tendances centrales des deux populations diffèrent. La procédure de calcul commence par combiner les deux échantillons et classer toutes les observations de la plus petite à la plus grande. Les valeurs à égalité reçoivent la moyenne des rangs qu’elles occuperaient autrement. La somme des rangs de chaque groupe est ensuite calculée séparément ; les statistiques U sont dérivées de ces sommes de rangs. Pour les échantillons plus grands, la distribution de U est bien approchée par une loi normale, et un score Z est utilisé pour obtenir la valeur p. L’hypothèse nulle affirme que les deux populations sont identiques — il n’existe aucune différence systématique entre leurs distributions. L’hypothèse alternative peut être bilatérale (toute différence), à queue droite (le groupe 1 tend à être plus grand) ou à queue gauche (le groupe 1 tend à être plus petit). Le type de queue doit être choisi avant la collecte des données, en fonction de votre question de recherche, afin d’éviter d’augmenter l’erreur de type I. La valeur p s’interprète par rapport au seuil de significativité α choisi (généralement 0,05). Si p < α, vous rejetez l’hypothèse nulle et concluez qu’une différence statistiquement significative existe entre les groupes. Si p ≥ α, les preuves sont insuffisantes pour conclure à une différence. Le test est largement utilisé en médecine pour comparer les résultats de patients entre groupes de traitement et groupes témoins lorsque la variable de résultat n’est pas normalement distribuée. En psychologie, il peut comparer des réponses d’enquête de type Likert entre groupes démographiques. En écologie, il peut tester si des mesures prises sur deux sites diffèrent significativement. En éducation, il compare les notes d’élèves enseignés par différentes méthodes. Pour de meilleurs résultats, assurez-vous que les observations au sein de chaque échantillon sont indépendantes les unes des autres et que les deux échantillons sont également indépendants l’un de l’autre. Le test est le plus puissant pour détecter des différences de position (déplacements de médiane) lorsque les distributions sous-jacentes ont des formes similaires.

Exemples pratiques

Explorez ces cas courants pour voir comment le test de somme des rangs de Wilcoxon est appliqué.

EntréeRésultatNote
S1: 7, 8, 8, 9, 10, 12 — S2: 9, 11, 12, 13, 14, 15 — α=0.05, two-tailedU=4, Z≈−2.24, p≈0.025Temps de récupération d’un médicament — différence significative ; le groupe traité récupère plus vite.
S1: 85, 90, 78, 92, 88, 76 — S2: 72, 80, 81, 75, 68, 79 — α=0.05, right-tailedU=6, Z≈1.92, p≈0.027Scores d’une méthode d’enseignement — la nouvelle méthode produit des scores significativement plus élevés.
S1: 120, 125, 130, 110, 115, 122, 128 — S2: 130, 135, 140, 128, 132, 138, 142 — α=0.01, left-tailedU=2, Z≈−2.88, p≈0.002Rendement des cultures avec engrais — l’engrais B donne un rendement significativement plus élevé.

Comment utiliser le calculateur

  1. Saisissez les valeurs numériques de l’échantillon 1 dans le premier champ, séparées par des virgules ou des espaces.
  2. Saisissez les valeurs de l’échantillon 2 indépendant dans le deuxième champ.
  3. Sélectionnez le seuil de significativité α (0,01, 0,05 ou 0,10) en cliquant sur le bouton correspondant.
  4. Choisissez le type de queue : bilatéral pour toute différence, queue droite si vous attendez un échantillon 1 plus grand, ou queue gauche si vous attendez un échantillon 1 plus petit.
  5. Cliquez sur Calculer pour voir la statistique U, le score Z, la valeur p et la décision statistique.

FAQ

Quelle est la différence entre le test de somme des rangs de Wilcoxon et le test U de Mann-Whitney ?
Ce sont le même test, avec des noms et des formulations différents. Wilcoxon a défini la statistique du test comme la somme des rangs, tandis que Mann et Whitney ont défini U comme le nombre de comparaisons par paires favorables à un groupe. Les deux statistiques sont linéairement liées et donnent des valeurs p identiques.
Quand dois-je utiliser le test de somme des rangs de Wilcoxon plutôt que le test t ?
Utilisez le test de Wilcoxon lorsque vos données sont ordinales, lorsque l’hypothèse de normalité est violée (surtout pour de petits échantillons) ou lorsqu’il existe des valeurs aberrantes. Pour de grands échantillons issus de distributions approximativement normales, le test t et le test de Wilcoxon donnent des résultats similaires, mais le test t a légèrement plus de puissance statistique.
Que signifie un test bilatéral par rapport à un test unilatéral ?
Un test bilatéral recherche toute différence entre les groupes, quelle que soit sa direction. Un test à queue droite vérifie si l’échantillon 1 tend à être plus grand que l’échantillon 2, et un test à queue gauche vérifie l’inverse. Le type de queue doit toujours être décidé selon votre hypothèse avant la collecte des données.
Comment le calculateur traite-t-il les valeurs à égalité ?
Les valeurs à égalité dans l’ensemble de données combiné reçoivent la moyenne des rangs qu’elles occuperaient. Par exemple, si deux observations sont à égalité pour les rangs 3 et 4, elles reçoivent toutes deux le rang 3,5. Cette correction par rang moyen garantit que les sommes de rangs restent valides et que l’approximation Z reste précise.
De quelle taille d’échantillon ai-je besoin pour une approximation fiable du score Z ?
L’approximation normale est généralement considérée comme suffisante lorsque n₁ et n₂ sont tous deux d’au moins 8 à 10. Pour de très petits échantillons (n < 8), il faut utiliser la distribution exacte de U. Ce calculateur utilise l’approximation normale, donc interprétez les valeurs p avec prudence pour de très petits échantillons.
Puis-je utiliser ce test avec des données non numériques ou ordinales ?
Oui. Tant que vous pouvez attribuer des rangs significatifs aux observations — par exemple des réponses sur une échelle de Likert (1 = pas du tout d’accord, 5 = tout à fait d’accord) — le test de somme des rangs de Wilcoxon est approprié. Il suffit de pouvoir ordonner les observations ; les distances numériques exactes ne sont pas nécessaires.