Calculadora de suma de rangos de Wilcoxon (Mann-Whitney U)

Compara dos muestras independientes con la prueba no paramétrica de suma de rangos de Wilcoxon (Mann-Whitney U). Obtén el estadístico U, la puntuación Z y el valor p sin suponer normalidad.

Introduce tus dos muestras independientes como números separados por comas, elige un nivel de significancia y el tipo de cola, y luego haz clic en Calcular.

Calculadora de suma de rangos de Wilcoxon (Mann-Whitney U)
Compara dos muestras independientes con la prueba no paramétrica de suma de rangos de Wilcoxon (Mann-Whitney U). Obtén el estadístico U, la puntuación Z y el valor p sin suponer normalidad.

Acerca de la prueba de suma de rangos de Wilcoxon

La prueba de suma de rangos de Wilcoxon, también conocida como prueba U de Mann-Whitney, es una prueba de hipótesis estadística no paramétrica que se utiliza para determinar si dos muestras independientes provienen de poblaciones con la misma distribución. A diferencia de la prueba t para muestras independientes, no supone que los datos sigan una distribución normal, lo que la convierte en una alternativa potente para datos ordinales, distribuciones sesgadas o muestras pequeñas en las que no puede verificarse la normalidad. La prueba fue propuesta originalmente por Frank Wilcoxon en 1945 y posteriormente ampliada por Mann y Whitney en 1947 hasta la forma que se usa hoy con mayor frecuencia. El estadístico U de Mann-Whitney cuenta cuántas veces un valor de un grupo supera a un valor del otro grupo. Un U grande para una muestra en relación con la otra aporta evidencia de que las medianas o tendencias centrales de ambas poblaciones difieren. El procedimiento de cálculo comienza combinando ambas muestras y ordenando todas las observaciones de menor a mayor. Los valores empatados reciben el promedio de los rangos que ocuparían. Luego se calcula por separado la suma de rangos de cada grupo; a partir de esas sumas se derivan los estadísticos U. Para muestras grandes, la distribución de U se aproxima bien con una distribución normal, y se usa una puntuación Z para obtener el valor p. La hipótesis nula establece que las dos poblaciones son idénticas — no existe una diferencia sistemática en sus distribuciones. La hipótesis alternativa puede ser bilateral (cualquier diferencia), de cola derecha (el grupo 1 tiende a ser mayor) o de cola izquierda (el grupo 1 tiende a ser menor). El tipo de cola debe decidirse antes de recolectar los datos, según la pregunta de investigación, para evitar inflar el error de tipo I. El valor p se interpreta en relación con el nivel de significancia α elegido (comúnmente 0.05). Si p < α, se rechaza la hipótesis nula y se concluye que existe una diferencia estadísticamente significativa entre los grupos. Si p ≥ α, no hay evidencia suficiente para concluir que existe una diferencia. La prueba se usa ampliamente en medicina para comparar resultados de pacientes entre grupos de tratamiento y control cuando el resultado puede no distribuirse normalmente. En psicología, permite comparar respuestas de encuestas tipo Likert entre grupos demográficos. En ecología, puede probar si las mediciones en dos sitios difieren significativamente. En educación, compara las calificaciones de estudiantes enseñados con métodos distintos. Para obtener los mejores resultados, asegúrate de que las observaciones dentro de cada muestra sean independientes entre sí y que las dos muestras también sean independientes una de la otra. La prueba es más potente para detectar diferencias de ubicación (desplazamientos de la mediana) cuando las distribuciones subyacentes tienen formas similares.

Ejemplos prácticos

Explora estos escenarios comunes para ver cómo se aplica la prueba de suma de rangos de Wilcoxon.

EntradaSalidaNota
S1: 7, 8, 8, 9, 10, 12 — S2: 9, 11, 12, 13, 14, 15 — α=0.05, two-tailedU=4, Z≈−2.24, p≈0.025Tiempos de recuperación de un medicamento — diferencia significativa; el grupo del medicamento se recupera más rápido.
S1: 85, 90, 78, 92, 88, 76 — S2: 72, 80, 81, 75, 68, 79 — α=0.05, right-tailedU=6, Z≈1.92, p≈0.027Puntuaciones de un método de enseñanza — el nuevo método produce puntuaciones significativamente más altas.
S1: 120, 125, 130, 110, 115, 122, 128 — S2: 130, 135, 140, 128, 132, 138, 142 — α=0.01, left-tailedU=2, Z≈−2.88, p≈0.002Rendimiento de cultivos con fertilizante — el fertilizante B produce un rendimiento significativamente mayor.

Cómo usar la calculadora

  1. Introduce los valores numéricos de la muestra 1 en el primer campo, separados por comas o espacios.
  2. Introduce los valores de la muestra 2 independiente en el segundo campo.
  3. Selecciona el nivel de significancia α (0.01, 0.05 o 0.10) haciendo clic en el botón correspondiente.
  4. Elige el tipo de cola: bilateral para cualquier diferencia, cola derecha si esperas que la muestra 1 sea mayor, o cola izquierda si esperas que la muestra 1 sea menor.
  5. Haz clic en Calcular para ver el estadístico U, la puntuación Z, el valor p y la decisión estadística.

Preguntas frecuentes

¿Cuál es la diferencia entre la prueba de suma de rangos de Wilcoxon y la prueba U de Mann-Whitney?
Son la misma prueba con distintos nombres y formulaciones. Wilcoxon definió el estadístico como la suma de rangos, mientras que Mann y Whitney definieron U como el conteo de comparaciones por pares que favorecen a uno de los grupos. Ambos estadísticos están relacionados linealmente y producen los mismos valores p.
¿Cuándo debo usar la prueba de suma de rangos de Wilcoxon en lugar de la prueba t?
Usa la prueba de Wilcoxon cuando tus datos sean ordinales, cuando se viole el supuesto de normalidad (especialmente en muestras pequeñas) o cuando haya valores atípicos. Para muestras grandes provenientes de distribuciones aproximadamente normales, la prueba t y la de Wilcoxon dan resultados similares, pero la prueba t tiene un poco más de potencia estadística.
¿Qué significa una prueba de dos colas frente a una de una cola?
Una prueba bilateral busca cualquier diferencia entre los grupos, sin importar la dirección. Una prueba de cola derecha verifica si la muestra 1 tiende a ser mayor que la muestra 2, y una de cola izquierda verifica lo contrario. El tipo de cola debe decidirse siempre antes de recolectar datos, según tu hipótesis.
¿Cómo maneja la calculadora los valores empatados?
Los valores empatados en el conjunto de datos combinado reciben el promedio de los rangos que ocuparían. Por ejemplo, si dos observaciones empatan en los rangos 3 y 4, ambas reciben 3.5. Esta corrección de rango medio asegura que las sumas de rangos sigan siendo válidas y que la aproximación Z sea precisa.
¿Qué tamaño de muestra necesito para una aproximación fiable de la puntuación Z?
En general, la aproximación normal se considera adecuada cuando tanto n₁ como n₂ son al menos 8–10. Para muestras muy pequeñas (n < 8), se debe usar la distribución exacta de U. Esta calculadora usa la aproximación normal, así que interpreta los valores p con cautela en muestras muy pequeñas.
¿Puedo usar esta prueba con datos no numéricos u ordinales?
Sí. Siempre que puedas asignar rangos significativos a las observaciones — por ejemplo, respuestas de una escala Likert (1 = muy en desacuerdo, 5 = muy de acuerdo) — la prueba de suma de rangos de Wilcoxon es apropiada. Solo necesitas poder ordenar las observaciones; no se requieren distancias numéricas exactas.