Calculadora de hipótesis - Z, T y p-valor
Realiza pruebas Z y T para medias y proporciones. Ingresa tus datos muestrales para calcular en segundos el estadístico, el p-valor y el valor crítico.
Selecciona el tipo de prueba y la hipótesis alternativa, ingresa tus datos y haz clic en Calcular para determinar si debes rechazar la hipótesis nula.
Calculadora de hipótesis - Z, T y p-valor
Realiza pruebas Z y T para medias y proporciones. Ingresa tus datos muestrales para calcular en segundos el estadístico, el p-valor y el valor crítico.
Acerca de la calculadora de hipótesis
La prueba de hipótesis es la base de la estadística inferencial. Ofrece un marco probabilístico y con fundamento para decidir si los datos que has recolectado son consistentes con una afirmación teórica —la hipótesis nula— o si la evidencia es suficiente para rechazarla a favor de una alternativa. Todo experimento en medicina, psicología, economía, control de calidad en ingeniería y pruebas A/B en sitios web termina por reducirse a alguna forma de prueba de hipótesis.
La hipótesis nula (H₀) es la suposición por defecto: no ocurrió nada, el tratamiento no tiene efecto, el proceso está en objetivo o las proporciones no cambiaron. La hipótesis alternativa (H₁) es lo que intentas detectar: la media se desplazó, la proporción cambió o un tratamiento es mejor que otro. El nivel de significancia α —normalmente 0.05 o 0.01— es la probabilidad de rechazar incorrectamente H₀ cuando en realidad es verdadera (error de Tipo I). Si el p-valor devuelto por la prueba es menor que α, rechazas H₀.
La prueba Z para medias es apropiada cuando la desviación estándar poblacional σ es conocida y el tamaño de muestra es grande (n ≥ 30) o la población es normal. El estadístico es Z = (x̄ − μ₀) / (σ / √n). Como σ es conocida, el estadístico sigue exactamente la distribución normal estándar, y el p-valor se obtiene de la tabla normal. La prueba T para medias se usa cuando σ es desconocida, que es la situación más realista en la mayoría de las investigaciones. En ese caso se usa la desviación estándar muestral s, y el estadístico T = (x̄ − μ₀) / (s / √n) sigue una distribución t con df = n − 1 grados de libertad. Con muestras pequeñas, la distribución t tiene colas más pesadas que la normal, lo que hace más difícil alcanzar significancia —un castigo razonable por la incertidumbre extra sobre σ.
La prueba Z para proporciones evalúa si una proporción muestral observada p̂ es consistente con una proporción poblacional hipotetizada p₀. El error estándar es √(p₀(1 − p₀) / n) y el estadístico es Z = (p̂ − p₀) / SE. Esta prueba se usa ampliamente en pruebas A/B, en endpoints primarios de ensayos clínicos y en gráficos de control de fracción defectuosa.
En una prueba bilateral, rechazas H₀ cuando |estadístico| > valor crítico, capturando desviaciones en cualquiera de las dos direcciones. En una prueba unilateral (izquierda o derecha) especificas la dirección con anticipación; esto da más potencia para detectar un cambio en esa dirección, pero no puede señalar un cambio inesperado en la otra. El valor crítico mostrado corresponde al límite de la cola derecha; para una prueba de cola izquierda, el límite relevante es su negativo.
El p-valor es la probabilidad de observar un estadístico de prueba al menos tan extremo como el calculado, suponiendo que H₀ es verdadera. Un p-valor de 0.03 no significa que haya un 3% de probabilidad de que la nula sea verdadera; significa que, si H₀ fuera verdadera, solo habría un 3% de probabilidad de ver datos tan extremos o más por puro muestreo aleatorio. La significancia estadística no es lo mismo que la significancia práctica: un efecto pequeño puede ser muy significativo con una n grande, mientras que un efecto grande puede no alcanzar significancia con una n pequeña. Siempre combina el p-valor con un tamaño del efecto y un intervalo de confianza.
Ejemplos de prueba de hipótesis
Escenarios reales que ilustran cada tipo de prueba y dirección de cola.
| Escenario | Resultado | Interpretación |
|---|---|---|
| Control de calidad: x̄=10.01mm, μ₀=10mm, σ=0.03, n=50, α=0.05, prueba Z bilateral | Z=2.357, p=0.0184 → Rechazar H₀ | El diámetro promedio del perno se ha desplazado significativamente del objetivo de 10 mm; el proceso necesita ajuste. |
| Ensayo de medicamento: x̄=12 mmHg, μ₀=10, s=3, n=30, α=0.05, prueba T de cola derecha | T=3.651, df=29, p=0.0005 → Rechazar H₀ | Hay evidencia sólida de que el fármaco reduce la presión arterial en más de 10 mmHg en promedio. |
| Prueba A/B: p̂=0.095, p₀=0.08, n=1000, α=0.05, prueba Z de cola derecha (proporción) | Z=1.750, p=0.0401 → Rechazar H₀ | El nuevo diseño del botón aumenta significativamente la tasa de clics por encima del 8% base. |
| Eficiencia de combustible: x̄=29 mpg, μ₀=30, σ=2, n=40, α=0.01, prueba Z de cola izquierda | Z=−3.162, p=0.0008 → Rechazar H₀ | Hay evidencia al 1% de que la eficiencia de combustible del modelo está por debajo de los 30 mpg anunciados. |
Cómo usar la calculadora de hipótesis
- Elige el tipo de prueba: Z (media) si σ es conocida, T (media) si σ es desconocida y tienes una desviación estándar muestral, o Z (proporción) para resultados categóricos.
- Selecciona la dirección de la hipótesis alternativa: bilateral para detectar cualquier cambio, cola izquierda para detectar una disminución o cola derecha para detectar un aumento.
- Ingresa el valor de la hipótesis nula (μ₀ para pruebas de medias o p₀ para pruebas de proporción), el nivel de significancia α elegido (normalmente 0.05) y el tamaño de muestra n.
- Completa el campo restante: media muestral x̄ y desviación estándar poblacional σ para Z (media); media muestral x̄ y desviación estándar muestral s para T; o proporción muestral p̂ para Z (proporción).
- Haz clic en Calcular. La herramienta muestra el estadístico de prueba, los grados de libertad (solo T), el p-valor, el valor crítico y la decisión de rechazar o no rechazar.
Preguntas frecuentes sobre prueba de hipótesis
¿Cuál es la diferencia entre una prueba Z y una prueba T?
Una prueba Z se usa cuando la desviación estándar poblacional σ es conocida, lo que permite usar la distribución normal estándar para calcular p-valores exactos. Una prueba T se usa cuando σ es desconocida y debe estimarse con la desviación estándar muestral s; el estadístico resultante sigue una distribución t con n−1 grados de libertad, que tiene colas más pesadas que la normal para reflejar la incertidumbre adicional. A medida que crece el tamaño de muestra, la t converge a la normal, así que la diferencia importa sobre todo en muestras pequeñas (aprox. n < 30).
¿Qué significa realmente el p-valor?
El p-valor es la probabilidad de obtener un estadístico de prueba al menos tan extremo como el observado, suponiendo que la hipótesis nula es verdadera. No es la probabilidad de que H₀ sea verdadera, ni la probabilidad de que tu resultado haya ocurrido por casualidad. Un p-valor por debajo de α (comúnmente 0.05) significa que los datos observados serían sorprendentes si H₀ fuera verdadera, por lo que se rechaza H₀. Un p-valor por encima de α significa que los datos son consistentes con H₀, así que no se rechaza, pero eso no prueba que H₀ sea correcta.
¿Cuándo debo usar una prueba unilateral y cuándo una bilateral?
Usa una prueba bilateral cuando una diferencia en cualquiera de las dos direcciones sea científicamente relevante y no tengas una razón fuerte para esperar una dirección específica. Usa una prueba unilateral cuando la teoría o la evidencia previa especifican claramente la dirección del efecto antes de recolectar datos. Cambiar a una prueba unilateral después de ver los datos para lograr significancia es p-hacking e invalida el análisis. Una prueba unilateral con α=0.05 equivale a una prueba bilateral con α=0.10.
¿Qué es el nivel de significancia α y cómo lo elijo?
El nivel de significancia α es la probabilidad máxima aceptable de un error de Tipo I, es decir, rechazar incorrectamente una hipótesis nula verdadera. La elección convencional es 0.05 (5%), pero se usa 0.01 cuando los falsos positivos son especialmente costosos (diagnóstico médico, sistemas críticos de seguridad). Algunas áreas recomiendan reportar p-valores exactos en lugar de depender de un umbral fijo, y combinarlos con intervalos de confianza y tamaños del efecto para tener una imagen más completa.
¿Qué son los errores de Tipo I y Tipo II?
Un error de Tipo I (falso positivo) ocurre cuando rechazas H₀ aunque sea verdadera; su probabilidad es α. Un error de Tipo II (falso negativo) ocurre cuando no rechazas H₀ aunque sea falsa; su probabilidad es β, y la potencia estadística es 1−β. Reducir α endurece el criterio de rechazo, lo que baja los errores de Tipo I pero aumenta los de Tipo II. Aumentar el tamaño de muestra es la forma más limpia de reducir ambos al mismo tiempo.
¿Puedo usar esta calculadora para proporciones de encuestas?
Sí — el modo de Prueba Z para Proporción está diseñado exactamente para eso. Ingresa la proporción poblacional hipotetizada p₀ (tu línea base o valor teórico), tu tamaño de muestra n y la proporción muestral observada p̂ (éxitos divididos entre n). La calculadora aplica la fórmula estándar Z = (p̂ − p₀) / √(p₀(1−p₀)/n). La aproximación normal es confiable cuando tanto n·p₀ como n·(1−p₀) superan 5 o 10.