Calculadora do teste de Wilcoxon - Amostras pareadas
Compare duas amostras relacionadas ou medições repetidas usando o teste não paramétrico de Wilcoxon. Obtenha a estatística W, o escore Z e o valor-p sem assumir normalidade.
Digite suas medições pareadas de antes/depois separadas por vírgulas. Ambas as amostras devem ter a mesma quantidade de valores.
Calculadora do teste de Wilcoxon - Amostras pareadas
Compare duas amostras relacionadas ou medições repetidas usando o teste não paramétrico de Wilcoxon. Obtenha a estatística W, o escore Z e o valor-p sem assumir normalidade.
Sobre o teste de Wilcoxon
O teste de postos sinalizados de Wilcoxon é um teste estatístico de hipótese não paramétrico usado para comparar duas amostras relacionadas ou medições repetidas em um único grupo. É o equivalente não paramétrico do teste t pareado, aplicado quando a suposição de normalidade das diferenças entre os pares não pode ser justificada.
Introduzido por Frank Wilcoxon em 1945, o teste é especialmente valioso em ensaios clínicos e nas ciências comportamentais, onde as mesmas pessoas são medidas antes e depois de uma intervenção. Em vez de usar os valores brutos, o teste ordena as diferenças absolutas entre observações pareadas e soma separadamente os postos associados às diferenças positivas e negativas.
O procedimento funciona assim: para cada par, calcula-se a diferença d = (after − before). Pares com diferença zero são excluídos. As diferenças absolutas são ranqueadas do menor para o maior valor, e empates recebem a média dos postos. A soma dos postos das diferenças positivas é W⁺, e a soma dos postos das diferenças negativas é W⁻. A estatística W é o menor entre W⁺ e W⁻.
Para amostras maiores (normalmente n ≥ 10), a distribuição de W é aproximada por uma normal. O escore Z é calculado usando a média e o desvio-padrão de W sob a hipótese nula. A média é n(n+1)/4 e o desvio-padrão é √[n(n+1)(2n+1)/24], onde n é a contagem de diferenças não nulas.
A hipótese nula afirma que a diferença mediana entre as observações pareadas é zero — o tratamento não tem efeito. A hipótese alternativa é que a diferença mediana não é zero (bicaudal) ou que é positiva ou negativa (unicaudal). Esta calculadora exibe o valor-p bicaudal, que é a escolha mais conservadora.
Um valor-p abaixo de 0.05 é convencionalmente interpretado como evidência de que as medições pareadas diferem de forma significativa. Em um estudo de pressão arterial, isso pode indicar que um medicamento reduziu significativamente a pressão sistólica. Em um estudo de psicologia, pode mostrar que um programa de terapia reduziu significativamente os escores de ansiedade.
O teste exige que as observações sejam pareadas — cada observação da Amostra 1 deve corresponder a uma observação específica da Amostra 2 (a mesma pessoa em outro momento ou sujeitos pareados). Os pares devem ser independentes entre si, e as diferenças devem vir de uma distribuição simétrica, embora não necessariamente normal.
Em comparação com o teste t pareado, o teste de Wilcoxon é mais robusto a outliers e distribuições não normais, mas um pouco menos potente quando a suposição de normalidade é válida. É a escolha recomendada para amostras pequenas, resultados ordinais ou quando há valores extremos nos dados.
Exemplos práticos
Use estes exemplos para ver como a calculadora funciona com diferentes conjuntos de dados pareados.
| Entrada | Saída | Observação |
|---|---|---|
| Antes: 140,135,150,160,130,145,155,138,148,152 — Depois: 132,130,142,151,125,137,145,130,140,148 | W=0, Z≈−2.80, p≈0.005 | Medicamento para pressão arterial — todas as diferenças são negativas, redução significativa. |
| Antes: 8,7,6,9,8,7,8,9 — Depois: 6,5,5,7,6,6,7,7 | W=0, Z≈−2.52, p≈0.012 | Escores de ansiedade após terapia — melhora significativa com α = 0.05. |
| Antes: 75,80,82,79,88,90,76,85,89,92,78,84 — Depois: 80,85,85,83,90,94,81,88,92,95,81,89 | W=0, Z≈+3.06, p≈0.002 | Notas de estudantes antes/depois de um novo método de ensino — ganho altamente significativo. |
Como usar a calculadora
- Digite as medições antes do tratamento (ou de linha de base) no campo da Amostra 1, separadas por vírgulas.
- Digite as medições correspondentes após o tratamento no campo da Amostra 2. As duas amostras devem ter exatamente a mesma quantidade de valores.
- Clique em Calcular para obter as diferenças, ranqueá-las e gerar a estatística W, o escore Z e o valor-p.
- Um valor-p abaixo de 0.05 (mostrado em vermelho) indica uma diferença estatisticamente significativa entre as duas condições.
- Use os botões de exemplo para carregar rapidamente conjuntos de dados reais e verificar a calculadora com resultados conhecidos.
Perguntas frequentes
Qual é a diferença entre o teste de Wilcoxon e o teste t pareado?
Ambos comparam medições pareadas, mas o teste t pareado assume que as diferenças são normalmente distribuídas. O teste de postos sinalizados de Wilcoxon não faz essa suposição e, por isso, é preferido para amostras pequenas, dados ordinais ou dados com outliers relevantes. Quando a normalidade vale, o teste t tem um pouco mais de poder.
O que acontece com pares com diferença zero?
Pares em que os valores antes e depois são idênticos (diferença = 0) são excluídos da análise. O tamanho amostral efetivo n usado para calcular a estatística e o valor-p conta apenas as diferenças não nulas. Esse é o procedimento padrão recomendado na maioria dos livros de estatística.
Como as diferenças empatadas são tratadas?
Quando vários pares produzem a mesma diferença absoluta, esses valores recebem a média dos postos que ocupariam. Por exemplo, três pares com |d| = 5 disputando os postos 4, 5 e 6 recebem posto 5 cada um. Essa correção por postos médios preserva a validade da aproximação Z.
Por que esta calculadora mostra apenas valor-p bicaudal?
O teste bicaudal é o mais conservador e o padrão na maioria dos estudos exploratórios. Ele testa se a diferença mediana é zero em qualquer direção. Para hipóteses direcionais (por exemplo, o tratamento sempre melhora os resultados), você pode dividir o valor-p bicaudal exibido por 2 para obter o valor-p unicaudal.
Qual tamanho de amostra é necessário para a aproximação Z ser válida?
A aproximação normal para a estatística W geralmente é confiável quando n ≥ 10 (após remover diferenças zero). Para amostras menores, consulte os valores críticos exatos da tabela de Wilcoxon. Esta calculadora usa a aproximação normal, então é preciso cautela com n < 10.