Calculadora t de muestras pareadas - antes y después

Realiza una prueba t de muestras pareadas para comparar dos grupos relacionados — mediciones antes/después, pares emparejados — y obtener el estadístico t, el valor p y el intervalo de confianza.

Introduce dos grupos de datos separados por comas y del mismo tamaño, define el nivel de significación y el tipo de prueba, y obtiene al instante el resultado completo de la prueba t pareada.

Calculadora t de muestras pareadas - antes y después
Realiza una prueba t de muestras pareadas para comparar dos grupos relacionados — mediciones antes/después, pares emparejados — y obtener el estadístico t, el valor p y el intervalo de confianza.

Acerca de la calculadora t de muestras pareadas

La prueba t de muestras pareadas (también llamada t de muestras dependientes o t de pares emparejados) es un procedimiento estadístico paramétrico que determina si la diferencia media entre dos conjuntos de mediciones relacionadas es significativamente distinta de cero (o de cualquier otro valor hipotetizado). Se llama “pareada” porque cada observación del grupo 1 corresponde exactamente a una observación del grupo 2: las dos mediciones proceden del mismo sujeto, de participantes emparejados o del mismo lugar medido en dos momentos distintos. La aplicación más común es un diseño antes y después: un investigador mide una característica (presión arterial, nota, peso, ventas) antes de una intervención y luego otra vez después. Como se mide a las mismas personas dos veces, los dos grupos no son independientes, sino correlacionados. Ignorar esa correlación y usar una t de muestras independientes sería incorrecto; subestimaría la precisión de la comparación al no tener en cuenta la variabilidad natural entre sujetos que se cancela al trabajar con diferencias. El truco computacional que hace elegante a la prueba t pareada es reducirla a un problema de una sola muestra. Para cada par i, calcula la diferencia d_i = Grupo1_i − Grupo2_i. Entonces la prueba pregunta: ¿la media de estas diferencias (d̄) es significativamente distinta de cero? Esto transforma el problema de dos muestras en una prueba t de una muestra sobre las diferencias. El estadístico es t = (d̄ − μ₀) / (s_d / √n), donde μ₀ es la diferencia media hipotetizada (normalmente 0), s_d es la desviación estándar muestral de las diferencias y n es el número de pares. Bajo la hipótesis nula, el estadístico sigue una distribución t de Student con df = n − 1 grados de libertad. El valor p de este estadístico te dice la probabilidad de observar una diferencia media tan grande como d̄ (o mayor) si la diferencia media real de la población fuera μ₀. Si el valor p está por debajo del nivel de significación α que elegiste, rechazas la hipótesis nula y concluyes que existe una diferencia media estadísticamente significativa entre las mediciones pareadas. El intervalo de confianza de d̄ ofrece un rango plausible para la diferencia media real y, a menudo, es más informativo que el valor p por sí solo. Para que la prueba t pareada sea válida, las diferencias d_i deben distribuirse aproximadamente de forma normal. Este supuesto se comprueba examinando un histograma o un gráfico Q-Q normal de las diferencias. Con n ≥ 30, el Teorema Central del Límite hace que este supuesto sea menos crítico incluso si las diferencias individuales no son normales. Para muestras pequeñas con diferencias claramente no normales, la prueba de rangos con signo de Wilcoxon es la alternativa no paramétrica. Las aplicaciones más comunes incluyen ensayos médicos de eficacia (antes y después de un fármaco), investigación educativa (pretest frente a postest), estudios de nutrición y fitness (mediciones de línea base frente a seguimiento) y analítica de negocios (ventas antes y después de una campaña publicitaria). En cada caso, el requisito clave es que cada par de valores proceda de la misma persona, entidad o unidad emparejada, no de dos grupos independientes.

Ejemplos resueltos

Tres escenarios de antes y después con datos realistas para ilustrar el resultado de la prueba t pareada.

Diseño del estudioEstadístico t / valor pConclusión
Presión arterial antes: 140,135,150,155,130,142,138,147,152,133 / después: 132,130,145,148,125,135,130,140,145,128 (bilateral, α=0.05, n=10)t ≈ 16.00, df = 9, p < 0.001Muy significativa. El fármaco redujo la presión sistólica media en 6.4 mmHg en 10 pacientes.
Notas antes: 75,80,82,70,88,65,90,78 / después: 85,85,88,78,92,75,95,85 (bilateral, α=0.05, n=8)t ≈ −8.47, df = 7, p < 0.001Mejora significativa. El alumnado obtuvo una media de 6.9 puntos más tras el programa de tutoría.
Ventas semanales antes: 500,550,480,600,520,530 / después: 540,580,500,650,550,560 (bilateral, α=0.05, n=6)t ≈ −7.91, df = 5, p < 0.001La campaña publicitaria aumentó significativamente las ventas semanales en una media de 33.3 unidades por tienda.

Cómo usar la calculadora t de muestras pareadas

  1. Introduce los datos del Grupo 1 (por ejemplo, valores “antes”) como una lista separada por comas en el primer campo.
  2. Introduce los datos del Grupo 2 (por ejemplo, valores “después”) en el segundo campo. Ambos grupos deben tener el mismo número de valores; el primer dato del Grupo 1 se empareja con el primero del Grupo 2, y así sucesivamente.
  3. Define el nivel de significación α (0.01, 0.05 o 0.10) y la diferencia media hipotetizada μ₀ (normalmente 0). Selecciona el tipo de prueba (bilateral, unilateral derecha o unilateral izquierda).
  4. Haz clic en Calcular para ver el estadístico t, los grados de libertad, el valor p, la diferencia media, la desviación estándar de las diferencias y un intervalo de confianza del 95%.
  5. Compara el valor p con α. Si p ≤ α, rechaza H₀ y concluye que existe una diferencia media estadísticamente significativa. Si p > α, no se rechaza H₀.

Preguntas frecuentes

¿Cuándo debo usar una prueba t pareada en lugar de una t independiente?
Usa una prueba t pareada cuando cada observación de un grupo esté naturalmente emparejada o vinculada con exactamente una observación del otro grupo — por ejemplo, la misma persona medida antes y después de un tratamiento, o dos hermanos asignados a dietas distintas. Si los dos grupos son independientes (personas distintas, sin relación ni emparejamiento), usa una prueba t de muestras independientes.
¿Qué es la diferencia media hipotetizada μ₀?
μ₀ es el valor que se supone que tiene la diferencia media real bajo la hipótesis nula. En la mayoría de los casos — cuando se quiere saber si una intervención tiene algún efecto — μ₀ = 0. Para hipótesis más específicas, como comprobar si un fármaco reduce la presión arterial al menos 10 mmHg, se fijaría μ₀ = 10.
¿Qué pasa si mis diferencias no se distribuyen normalmente?
La prueba t pareada asume que las diferencias se distribuyen aproximadamente de forma normal. Con n ≥ 30 pares, el Teorema Central del Límite hace menos crítica esa suposición. Para muestras pequeñas con diferencias claramente no normales (comprueba un histograma), la prueba de rangos con signo de Wilcoxon es una alternativa no paramétrica robusta que no asume normalidad.
¿Cómo interpreto el intervalo de confianza?
El intervalo de confianza del 95% ofrece un rango de valores plausibles para la diferencia media real. Si el intervalo no incluye cero, el resultado es significativo con α = 0.05. El intervalo es más informativo que el valor p por sí solo porque muestra la magnitud y la dirección del efecto. Por ejemplo, un IC de (2.3, 9.8) indica que el efecto es significativo y que va de pequeño a moderadamente grande.
¿Puedo hacer una prueba t pareada unilateral?
Sí. Selecciona “Unilateral derecha” si predices que Grupo 1 > Grupo 2 (diferencia media positiva), o “Unilateral izquierda” si predices que Grupo 1 < Grupo 2 (diferencia media negativa). Una prueba unilateral tiene más potencia, pero solo es válida cuando la dirección del efecto se especificó antes de recoger los datos. Usar una prueba unilateral solo porque el resultado bilateral quedó cerca del umbral es una forma de p-hacking.
¿Qué significa realmente un resultado significativo?
Un resultado significativo (p ≤ α) significa que la diferencia media observada es poco probable que haya ocurrido por azar si la hipótesis nula fuera verdadera. No demuestra que la hipótesis nula sea falsa ni garantiza que el efecto sea grande o clínicamente importante. Informa siempre la diferencia media d̄, su intervalo de confianza y un tamaño del efecto (como d de Cohen = d̄ / s_d) para que se pueda valorar la importancia práctica.