Calculadora do teste de Wilcoxon - Amostras pareadas

Compare duas amostras relacionadas ou medições repetidas usando o teste não paramétrico de Wilcoxon. Obtenha a estatística W, o escore Z e o valor-p sem assumir normalidade.

Digite suas medições pareadas de antes/depois separadas por vírgulas. Ambas as amostras devem ter a mesma quantidade de valores.

Calculadora do teste de Wilcoxon - Amostras pareadas
Compare duas amostras relacionadas ou medições repetidas usando o teste não paramétrico de Wilcoxon. Obtenha a estatística W, o escore Z e o valor-p sem assumir normalidade.

Sobre o teste de Wilcoxon

O teste de postos sinalizados de Wilcoxon é um teste estatístico de hipótese não paramétrico usado para comparar duas amostras relacionadas ou medições repetidas em um único grupo. É o equivalente não paramétrico do teste t pareado, aplicado quando a suposição de normalidade das diferenças entre os pares não pode ser justificada. Introduzido por Frank Wilcoxon em 1945, o teste é especialmente valioso em ensaios clínicos e nas ciências comportamentais, onde as mesmas pessoas são medidas antes e depois de uma intervenção. Em vez de usar os valores brutos, o teste ordena as diferenças absolutas entre observações pareadas e soma separadamente os postos associados às diferenças positivas e negativas. O procedimento funciona assim: para cada par, calcula-se a diferença d = (after − before). Pares com diferença zero são excluídos. As diferenças absolutas são ranqueadas do menor para o maior valor, e empates recebem a média dos postos. A soma dos postos das diferenças positivas é W⁺, e a soma dos postos das diferenças negativas é W⁻. A estatística W é o menor entre W⁺ e W⁻. Para amostras maiores (normalmente n ≥ 10), a distribuição de W é aproximada por uma normal. O escore Z é calculado usando a média e o desvio-padrão de W sob a hipótese nula. A média é n(n+1)/4 e o desvio-padrão é √[n(n+1)(2n+1)/24], onde n é a contagem de diferenças não nulas. A hipótese nula afirma que a diferença mediana entre as observações pareadas é zero — o tratamento não tem efeito. A hipótese alternativa é que a diferença mediana não é zero (bicaudal) ou que é positiva ou negativa (unicaudal). Esta calculadora exibe o valor-p bicaudal, que é a escolha mais conservadora. Um valor-p abaixo de 0.05 é convencionalmente interpretado como evidência de que as medições pareadas diferem de forma significativa. Em um estudo de pressão arterial, isso pode indicar que um medicamento reduziu significativamente a pressão sistólica. Em um estudo de psicologia, pode mostrar que um programa de terapia reduziu significativamente os escores de ansiedade. O teste exige que as observações sejam pareadas — cada observação da Amostra 1 deve corresponder a uma observação específica da Amostra 2 (a mesma pessoa em outro momento ou sujeitos pareados). Os pares devem ser independentes entre si, e as diferenças devem vir de uma distribuição simétrica, embora não necessariamente normal. Em comparação com o teste t pareado, o teste de Wilcoxon é mais robusto a outliers e distribuições não normais, mas um pouco menos potente quando a suposição de normalidade é válida. É a escolha recomendada para amostras pequenas, resultados ordinais ou quando há valores extremos nos dados.

Exemplos práticos

Use estes exemplos para ver como a calculadora funciona com diferentes conjuntos de dados pareados.

EntradaSaídaObservação
Antes: 140,135,150,160,130,145,155,138,148,152 — Depois: 132,130,142,151,125,137,145,130,140,148W=0, Z≈−2.80, p≈0.005Medicamento para pressão arterial — todas as diferenças são negativas, redução significativa.
Antes: 8,7,6,9,8,7,8,9 — Depois: 6,5,5,7,6,6,7,7W=0, Z≈−2.52, p≈0.012Escores de ansiedade após terapia — melhora significativa com α = 0.05.
Antes: 75,80,82,79,88,90,76,85,89,92,78,84 — Depois: 80,85,85,83,90,94,81,88,92,95,81,89W=0, Z≈+3.06, p≈0.002Notas de estudantes antes/depois de um novo método de ensino — ganho altamente significativo.

Como usar a calculadora

  1. Digite as medições antes do tratamento (ou de linha de base) no campo da Amostra 1, separadas por vírgulas.
  2. Digite as medições correspondentes após o tratamento no campo da Amostra 2. As duas amostras devem ter exatamente a mesma quantidade de valores.
  3. Clique em Calcular para obter as diferenças, ranqueá-las e gerar a estatística W, o escore Z e o valor-p.
  4. Um valor-p abaixo de 0.05 (mostrado em vermelho) indica uma diferença estatisticamente significativa entre as duas condições.
  5. Use os botões de exemplo para carregar rapidamente conjuntos de dados reais e verificar a calculadora com resultados conhecidos.

Perguntas frequentes

Qual é a diferença entre o teste de Wilcoxon e o teste t pareado?
Ambos comparam medições pareadas, mas o teste t pareado assume que as diferenças são normalmente distribuídas. O teste de postos sinalizados de Wilcoxon não faz essa suposição e, por isso, é preferido para amostras pequenas, dados ordinais ou dados com outliers relevantes. Quando a normalidade vale, o teste t tem um pouco mais de poder.
O que acontece com pares com diferença zero?
Pares em que os valores antes e depois são idênticos (diferença = 0) são excluídos da análise. O tamanho amostral efetivo n usado para calcular a estatística e o valor-p conta apenas as diferenças não nulas. Esse é o procedimento padrão recomendado na maioria dos livros de estatística.
Como as diferenças empatadas são tratadas?
Quando vários pares produzem a mesma diferença absoluta, esses valores recebem a média dos postos que ocupariam. Por exemplo, três pares com |d| = 5 disputando os postos 4, 5 e 6 recebem posto 5 cada um. Essa correção por postos médios preserva a validade da aproximação Z.
Por que esta calculadora mostra apenas valor-p bicaudal?
O teste bicaudal é o mais conservador e o padrão na maioria dos estudos exploratórios. Ele testa se a diferença mediana é zero em qualquer direção. Para hipóteses direcionais (por exemplo, o tratamento sempre melhora os resultados), você pode dividir o valor-p bicaudal exibido por 2 para obter o valor-p unicaudal.
Qual tamanho de amostra é necessário para a aproximação Z ser válida?
A aproximação normal para a estatística W geralmente é confiável quando n ≥ 10 (após remover diferenças zero). Para amostras menores, consulte os valores críticos exatos da tabela de Wilcoxon. Esta calculadora usa a aproximação normal, então é preciso cautela com n < 10.