Calculadora de prueba F para igualdad de dos varianzas
Determina si dos varianzas poblacionales son iguales con la prueba F. Obtén el estadístico F, el p-valor, los grados de libertad y una decisión clara.
Introduce la varianza muestral y el tamaño de muestra de cada grupo, define el nivel de significación y ve al instante si las dos varianzas son estadísticamente iguales.
Prueba F para igualdad de dos varianzas
Contrasta si dos muestras independientes tienen varianzas poblacionales iguales
Grupo 1
Grupo 2
Acerca de la prueba F para igualdad de dos varianzas
La prueba F para igualdad de dos varianzas es un procedimiento estadístico clásico usado para determinar si dos poblaciones independientes tienen la misma varianza. Nombrada en honor a Sir Ronald A. Fisher, se usa ampliamente como comprobación diagnóstica antes de aplicar una prueba t de dos muestras, que asume que los dos grupos tienen varianzas poblacionales iguales. Si la prueba F rechaza ese supuesto, debe usarse en su lugar la prueba t de Welch, que no requiere varianzas iguales.
El estadístico de prueba es la razón de las dos varianzas muestrales: F = s₁² / s₂². Por convención, la varianza muestral mayor se coloca en el numerador para que F ≥ 1, lo que concentra toda la masa crítica en la cola superior de la distribución F y simplifica la interpretación. La hipótesis nula H₀ afirma que las varianzas poblacionales son iguales (σ₁² = σ₂²), mientras que la hipótesis alternativa H₁ afirma que difieren (σ₁² ≠ σ₂²). Los grados de libertad son df₁ = n₁ − 1 (numerador) y df₂ = n₂ − 1 (denominador), donde n₁ y n₂ son los tamaños de muestra respectivos.
Para evaluar la significación, el valor F calculado se compara con la distribución F con (df₁, df₂) grados de libertad. En una prueba bilateral, el p-valor es igual a 2 × P(F > F_obs). Si el p-valor es menor o igual que el nivel de significación α elegido (normalmente 0.05 o 0.01), se rechaza H₀ y se declaran las varianzas significativamente diferentes. El valor F crítico para el α elegido proporciona una frontera de decisión equivalente: si F_obs > F_crit, se rechaza H₀.
La prueba F tiene amplias aplicaciones prácticas. En manufactura, verifica si dos líneas de producción fabrican piezas con igual variabilidad dimensional, un requisito previo para procedimientos de control de calidad que asumen procesos uniformes. En investigación clínica, comprueba si dos grupos de tratamiento tienen una variabilidad de respuesta similar, lo que afecta tanto el diseño del estudio como la interpretación. En finanzas, compara la volatilidad de dos activos o carteras, informando la evaluación de riesgos y las estrategias de diversificación. En agricultura, evalúa si dos fertilizantes producen cultivos con igual consistencia de rendimiento.
A pesar de su potencia, la prueba F tiene una limitación importante: es muy sensible a las desviaciones de la normalidad. Ambas muestras deben provenir de poblaciones normalmente distribuidas para que la prueba sea válida. Cuando la normalidad es incierta, los analistas suelen preferir la prueba de Levene o la prueba de Brown–Forsythe, más robustas, que sustituyen las desviaciones brutas respecto de la media por desviaciones absolutas o desviaciones respecto de la mediana. Esta calculadora usa la CDF exacta de la distribución F mediante la función beta incompleta regularizada, produciendo p-valores coherentes con R (var.test), Python (scipy.stats.levene) y SPSS.
Prueba F para igualdad de varianzas — ejemplos
Tres ejemplos resueltos de manufactura, educación y finanzas.
| Entrada | Resultado | Contexto |
|---|---|---|
| s₁² = 0.34, n₁ = 25; s₂² = 0.29, n₂ = 25; α = 0.05 | F = 1.1724, p ≈ 0.6767 — no rechazar H₀ | Dos máquinas producen pernos. Las varianzas del diámetro de los pernos no son significativamente diferentes; ambas máquinas son igual de consistentes. |
| s₁² = 110, n₁ = 41; s₂² = 125, n₂ = 31; α = 0.05 | F = 1.1364, p ≈ 0.6679 — no rechazar H₀ | Dos métodos de enseñanza. Las varianzas de las puntuaciones son estadísticamente iguales; ambos métodos producen una consistencia similar en los resultados. |
| s₁² = 5.2, n₁ = 100; s₂² = 4.8, n₂ = 100; α = 0.01 | F = 1.0833, p ≈ 0.6366 — no rechazar H₀ | Dos acciones comparadas por volatilidad de rendimientos diarios. Al nivel del 1%, no hay evidencia de perfiles de riesgo diferentes. |
| s₁² = 18, n₁ = 16; s₂² = 12, n₂ = 16; α = 0.10 | F = 1.5, p ≈ 0.3952 — no rechazar H₀ | Altura de plantas con dos fertilizantes. La varianza del crecimiento no es estadísticamente diferente al nivel del 10%. |
Cómo usar la calculadora de prueba F para igualdad de varianzas
- Introduce la varianza muestral (s²) del Grupo 1 —la desviación cuadrática media respecto de la media del grupo— junto con el número de observaciones (n) de ese grupo.
- Introduce la varianza y el tamaño de muestra correspondientes del Grupo 2 en sus campos.
- Elige un nivel de significación α en el menú desplegable: 0.01 (1%), 0.05 (5%) o 0.10 (10%). La opción más común en investigaciones publicadas es 0.05.
- Haz clic en “Calcular”. La calculadora coloca automáticamente la varianza mayor en el numerador, calcula F = s_max²/s_min², obtiene el p-valor bilateral con la distribución F y muestra el valor F crítico.
- Interpreta el resultado: si p-valor ≤ α, las varianzas son significativamente diferentes y deberías usar una prueba t de Welch en lugar de una prueba t estándar con varianzas iguales. En caso contrario, se pueden asumir varianzas iguales.
Prueba F para igualdad de varianzas — preguntas frecuentes
¿Qué evalúa la prueba F para igualdad de varianzas?
Evalúa la hipótesis nula H₀: σ₁² = σ₂² frente a la alternativa H₁: σ₁² ≠ σ₂². Un resultado significativo (p ≤ α) significa que las dos varianzas poblacionales son estadísticamente diferentes. Un resultado no significativo significa que los datos son compatibles con varianzas iguales, pero no prueba que sean iguales.
¿Por qué se usa la prueba F antes de una prueba t de dos muestras?
La prueba t de dos muestras con varianza combinada asume que ambos grupos tienen la misma varianza poblacional. Si este supuesto se viola, la prueba puede producir p-valores incorrectos. Ejecutar primero una prueba F comprueba este supuesto: si la prueba F es significativa, usa la prueba t de Welch, que no asume varianzas iguales.
¿Cuáles son los supuestos de la prueba F para igualdad de varianzas?
Ambas muestras deben extraerse de poblaciones con distribución normal, y las muestras deben ser independientes entre sí. La prueba F es bastante sensible a la no normalidad; incluso desviaciones moderadas pueden distorsionar el p-valor. Si la normalidad es dudosa, usa la prueba de Levene o la prueba de Brown–Forsythe.
¿Por qué la varianza mayor siempre se coloca en el numerador?
Colocar la varianza mayor en el numerador garantiza F ≥ 1, lo que confina la región crítica a la cola superior de la distribución F y evita consultar una tabla de cola inferior. Para una prueba bilateral, el p-valor es simplemente 2 × P(F > F_obs), lo que es directo de calcular.
¿Cómo interpreto el valor F crítico?
El valor F crítico (F_crit) es el valor que recorta el α/2 superior de la distribución F. Si tu F calculado supera F_crit, rechazas H₀ al nivel de significación α. Usar el p-valor y usar el valor crítico siempre llevan a la misma decisión: son dos formas equivalentes de resumir la misma comparación.
¿Cuándo debería usar la prueba de Levene en lugar de la prueba F?
La prueba de Levene es preferible cuando tus datos podrían no seguir una distribución normal, porque es robusta frente a la no normalidad. La prueba F para igualdad de varianzas es óptima cuando se cumple la normalidad, pero su tasa de error de tipo I puede distorsionarse gravemente con datos sesgados o de colas pesadas. En la práctica, muchos estadísticos usan la prueba de Levene por defecto para evitar este riesgo.