Wilcoxon Rank Sum Test Calculator (Mann-Whitney U)

Compare duas amostras independentes usando o teste não paramétrico de Wilcoxon de soma dos rangos (Mann-Whitney U). Obtenha U, Z e p sem assumir normalidade.

Digite suas duas amostras independentes como números separados por vírgulas, escolha o nível de significância e o tipo de cauda e clique em Calcular.

Wilcoxon Rank Sum Test Calculator (Mann-Whitney U)
Compare duas amostras independentes usando o teste não paramétrico de Wilcoxon de soma dos rangos (Mann-Whitney U). Obtenha U, Z e p sem assumir normalidade.

Sobre o teste de Wilcoxon de soma dos rangos

O teste de Wilcoxon de soma dos rangos, também conhecido como teste U de Mann-Whitney, é um teste estatístico de hipótese não paramétrico usado para determinar se duas amostras independentes vêm de populações com a mesma distribuição. Diferente do teste t para amostras independentes, ele não assume que os dados sigam uma distribuição normal, o que o torna uma alternativa poderosa para dados ordinais, distribuições assimétricas ou amostras pequenas em que a normalidade não pode ser estabelecida. O teste foi proposto originalmente por Frank Wilcoxon em 1945 e depois estendido por Mann e Whitney em 1947 para a forma mais usada hoje. A estatística U de Mann-Whitney conta quantas vezes um valor de um grupo excede um valor do outro grupo. Um U grande para uma amostra em relação à outra fornece evidência de que as medianas ou tendências centrais das duas populações diferem. O cálculo começa combinando as duas amostras e classificando todas as observações da menor para a maior. Valores empatados recebem a média dos postos que ocupariam de outra forma. Em seguida, a soma dos postos de cada grupo é calculada separadamente; as estatísticas U são então derivadas dessas somas de postos. Para amostras maiores, a distribuição de U é bem aproximada por uma distribuição normal, e um valor Z é usado para obter o p-valor. A hipótese nula afirma que as duas populações são idênticas — não há diferença sistemática em suas distribuições. A hipótese alternativa pode ser bicaudal (qualquer diferença), caudal à direita (o grupo 1 tende a ser maior) ou caudal à esquerda (o grupo 1 tende a ser menor). Escolha a cauda apropriada com base na sua pergunta de pesquisa antes de coletar os dados para evitar inflar o erro do Tipo I. O p-valor é interpretado em relação ao nível de significância α escolhido (comumente 0,05). Se p < α, você rejeita a hipótese nula e conclui que existe uma diferença estatisticamente significativa entre os grupos. Se p ≥ α, a evidência é insuficiente para concluir que existe uma diferença. O teste é amplamente usado na medicina para comparar resultados de pacientes entre grupos de tratamento e controle quando o resultado pode não ser normalmente distribuído. Em psicologia, ele pode comparar respostas de escala Likert entre grupos demográficos. Em ecologia, pode testar se medições em dois locais diferem significativamente. Em educação, compara notas de alunos ensinados por métodos diferentes. Para melhores resultados, garanta que as observações dentro de cada amostra sejam independentes entre si e que as duas amostras sejam independentes uma da outra. O teste é mais poderoso para detectar diferenças de localização (deslocamentos de mediana) quando as distribuições subjacentes têm formatos semelhantes.

Exemplos práticos

Explore estes cenários comuns para ver como o teste de Wilcoxon de soma dos rangos é aplicado.

EntradaSaídaObservação
S1: 7, 8, 8, 9, 10, 12 — S2: 9, 11, 12, 13, 14, 15 — α=0.05, two-tailedU=4, Z≈−2.24, p≈0.025Tempos de recuperação de um medicamento — diferença significativa; o grupo do medicamento se recupera mais rápido.
S1: 85, 90, 78, 92, 88, 76 — S2: 72, 80, 81, 75, 68, 79 — α=0.05, right-tailedU=6, Z≈1.92, p≈0.027Notas de método de ensino — o novo método produz pontuações significativamente mais altas.
S1: 120, 125, 130, 110, 115, 122, 128 — S2: 130, 135, 140, 128, 132, 138, 142 — α=0.01, left-tailedU=2, Z≈−2.88, p≈0.002Rendimento de safra com fertilizante — o fertilizante B rende significativamente mais.

Como usar a calculadora

  1. Digite os valores numéricos da amostra 1 no primeiro campo, separados por vírgulas ou espaços.
  2. Digite os valores da amostra independente 2 no segundo campo.
  3. Selecione o nível de significância α (0,01, 0,05 ou 0,10) clicando no botão correspondente.
  4. Escolha o tipo de cauda: bilateral para qualquer diferença, cauda à direita se você espera que a amostra 1 seja maior, ou cauda à esquerda se espera que a amostra 1 seja menor.
  5. Clique em Calcular para ver a estatística U, o valor Z, o p-valor e a decisão estatística.

FAQ

Qual é a diferença entre o teste de Wilcoxon de soma dos rangos e o teste U de Mann-Whitney?
São o mesmo teste, com nomes e formulações diferentes. Wilcoxon definiu a estatística como soma dos postos, enquanto Mann e Whitney definiram U como a contagem de comparações pareadas favoráveis a um grupo. As duas estatísticas são linearmente relacionadas e geram os mesmos p-valores.
Quando devo usar o teste de Wilcoxon de soma dos rangos em vez do teste t?
Use o teste de Wilcoxon quando seus dados forem ordinais, quando a suposição de normalidade for violada (especialmente em amostras pequenas) ou quando houver outliers. Em amostras grandes com distribuições aproximadamente normais, o teste t e o teste de Wilcoxon dão resultados semelhantes, mas o teste t tem um pouco mais de poder estatístico.
O que significa um teste bicaudal versus unicamente caudal?
Um teste bicaudal verifica qualquer diferença entre os grupos, independentemente da direção. Um teste de cauda à direita verifica se a amostra 1 tende a ser maior que a amostra 2, e um de cauda à esquerda verifica o oposto. Sempre decida o tipo de cauda com base na sua hipótese antes de coletar os dados.
Como a calculadora trata valores empatados?
Valores empatados no conjunto de dados combinado recebem a média dos postos que ocupariam. Por exemplo, se duas observações empatam nos postos 3 e 4, ambas recebem 3,5. Essa correção de posto médio mantém as somas de postos válidas e a aproximação Z precisa.
Que tamanho de amostra preciso para uma aproximação confiável do valor Z?
Em geral, a aproximação normal é considerada adequada quando n₁ e n₂ são pelo menos 8–10. Para amostras muito pequenas (n < 8), deve-se usar a distribuição exata de U. Esta calculadora usa a aproximação normal, então interprete os p-valores com cautela em amostras muito pequenas.
Posso usar este teste com dados não numéricos ou ordinais?
Sim. Desde que você possa atribuir postos significativos às observações — como respostas em escala Likert (1=discordo totalmente, 5=concordo totalmente) — o teste de Wilcoxon de soma dos rangos é apropriado. Basta conseguir ordenar as observações; não são necessárias distâncias numéricas exatas.