Calculadora de teste F para igualdade de duas variâncias
Determine se duas variâncias populacionais são iguais usando o teste F. Obtenha a estatística F, o valor-p, os graus de liberdade e uma decisão estatística clara.
Insira a variância amostral e o tamanho da amostra de cada grupo, defina o nível de significância e veja instantaneamente se as duas variâncias são estatisticamente iguais.
Teste F para igualdade de duas variâncias
Teste se duas amostras independentes têm variâncias populacionais iguais
Grupo 1
Grupo 2
Sobre o teste F para igualdade de duas variâncias
O teste F para igualdade de duas variâncias é um procedimento estatístico clássico usado para determinar se duas populações independentes têm a mesma variância. Batizado em homenagem a Sir Ronald A. Fisher, o teste é amplamente usado como verificação diagnóstica antes da aplicação de um teste t para duas amostras, que pressupõe que os dois grupos tenham variâncias populacionais iguais. Se o teste F rejeitar essa suposição, deve-se usar o teste t de Welch, que não exige variâncias iguais.
A estatística de teste é a razão entre as duas variâncias amostrais: F = s₁² / s₂². Por convenção, a maior variância amostral é colocada no numerador para que F ≥ 1, o que restringe toda a massa crítica à cauda superior da distribuição F e simplifica a interpretação. A hipótese nula H₀ afirma que as variâncias populacionais são iguais (σ₁² = σ₂²), enquanto a hipótese alternativa H₁ afirma que elas diferem (σ₁² ≠ σ₂²). Os graus de liberdade são df₁ = n₁ − 1 (numerador) e df₂ = n₂ − 1 (denominador), em que n₁ e n₂ são os respectivos tamanhos amostrais.
Para avaliar a significância, o valor F calculado é comparado à distribuição F com (df₁, df₂) graus de liberdade. Em um teste bicaudal, o valor-p é igual a 2 × P(F > F_obs). Se o valor-p for menor ou igual ao nível de significância α escolhido (normalmente 0.05 ou 0.01), H₀ é rejeitada e as variâncias são declaradas significativamente diferentes. O valor F crítico no α escolhido fornece uma fronteira de decisão equivalente: se F_obs > F_crit, rejeite H₀.
O teste F tem ampla aplicação prática. Na manufatura, verifica se duas linhas de produção fabricam peças com igual variabilidade dimensional — um pré-requisito para procedimentos de controle de qualidade que assumem processos uniformes. Na pesquisa clínica, verifica se dois grupos de tratamento têm variabilidade de resposta semelhante, o que afeta tanto o desenho do estudo quanto a interpretação. Em finanças, compara a volatilidade de dois ativos ou carteiras, orientando avaliação de risco e estratégias de diversificação. Na agricultura, avalia se dois fertilizantes produzem culturas com igual consistência de rendimento.
Apesar de seu poder, o teste F tem uma limitação importante: é muito sensível a desvios da normalidade. Ambas as amostras devem vir de populações normalmente distribuídas para que o teste seja válido. Quando a normalidade é incerta, analistas costumam preferir o teste de Levene ou o teste de Brown–Forsythe, mais robustos, que substituem desvios brutos em relação à média por desvios absolutos ou desvios em relação à mediana. Esta calculadora usa a CDF exata da distribuição F por meio da função beta incompleta regularizada, produzindo valores-p consistentes com R (var.test), Python (scipy.stats.levene) e SPSS.
Teste F para igualdade de variâncias — exemplos
Três exemplos resolvidos de manufatura, educação e finanças.
| Entrada | Resultado | Contexto |
|---|---|---|
| s₁² = 0.34, n₁ = 25; s₂² = 0.29, n₂ = 25; α = 0.05 | F = 1.1724, p ≈ 0.6767 — não rejeitar H₀ | Duas máquinas produzem parafusos. As variâncias dos diâmetros não são significativamente diferentes; ambas as máquinas são igualmente consistentes. |
| s₁² = 110, n₁ = 41; s₂² = 125, n₂ = 31; α = 0.05 | F = 1.1364, p ≈ 0.6679 — não rejeitar H₀ | Dois métodos de ensino. As variâncias das notas são estatisticamente iguais; ambos os métodos produzem consistência semelhante nos resultados. |
| s₁² = 5.2, n₁ = 100; s₂² = 4.8, n₂ = 100; α = 0.01 | F = 1.0833, p ≈ 0.6366 — não rejeitar H₀ | Duas ações comparadas pela volatilidade dos retornos diários. No nível de 1%, não há evidência de perfis de risco diferentes. |
| s₁² = 18, n₁ = 16; s₂² = 12, n₂ = 16; α = 0.10 | F = 1.5, p ≈ 0.3952 — não rejeitar H₀ | Altura de plantas sob dois fertilizantes. A variância no crescimento das plantas não é estatisticamente diferente no nível de 10%. |
Como usar a calculadora de teste F para igualdade de variâncias
- Insira a variância amostral (s²) do Grupo 1 — o desvio quadrático médio em relação à média do grupo — junto com o número de observações (n) desse grupo.
- Insira a variância e o tamanho da amostra correspondentes do Grupo 2 nos campos do Grupo 2.
- Escolha um nível de significância α no menu suspenso: 0.01 (1%), 0.05 (5%) ou 0.10 (10%). A escolha mais comum em pesquisas publicadas é 0.05.
- Clique em “Calcular”. A calculadora coloca automaticamente a maior variância no numerador, calcula F = s_max²/s_min², calcula o valor-p bicaudal usando a distribuição F e exibe o valor F crítico.
- Interprete o resultado: se valor-p ≤ α, as variâncias são significativamente diferentes e você deve usar um teste t de Welch em vez de um teste t padrão com variâncias iguais. Caso contrário, variâncias iguais podem ser assumidas.
Teste F para igualdade de variâncias — perguntas frequentes
O que o teste F para igualdade de variâncias testa?
Ele testa a hipótese nula H₀: σ₁² = σ₂² contra a alternativa H₁: σ₁² ≠ σ₂². Um resultado significativo (p ≤ α) significa que as duas variâncias populacionais são estatisticamente diferentes. Um resultado não significativo significa que os dados são compatíveis com variâncias iguais, mas não prova que elas sejam iguais.
Por que o teste F é usado antes de um teste t para duas amostras?
O teste t para duas amostras com variância combinada pressupõe que ambos os grupos tenham a mesma variância populacional. Se essa suposição for violada, o teste pode produzir valores-p incorretos. Executar primeiro um teste F verifica essa suposição: se o teste F for significativo, use o teste t de Welch, que não pressupõe variâncias iguais.
Quais são as suposições do teste F para igualdade de variâncias?
Ambas as amostras devem ser extraídas de populações normalmente distribuídas, e as amostras devem ser independentes entre si. O teste F é bastante sensível à não normalidade; mesmo desvios moderados podem distorcer o valor-p. Se a normalidade for duvidosa, use o teste de Levene ou o teste de Brown–Forsythe.
Por que a maior variância sempre fica no numerador?
Colocar a maior variância no numerador garante F ≥ 1, o que confina a região crítica à cauda superior da distribuição F e evita a necessidade de consultar uma tabela de cauda inferior. Para um teste bicaudal, o valor-p é simplesmente 2 × P(F > F_obs), o que é direto de calcular.
Como interpreto o valor F crítico?
O valor F crítico (F_crit) é o valor que corta o α/2 superior da distribuição F. Se o F calculado exceder F_crit, você rejeita H₀ no nível de significância α. Usar o valor-p e usar o valor crítico sempre leva à mesma decisão — são duas formas equivalentes de resumir a mesma comparação.
Quando devo usar o teste de Levene em vez do teste F?
O teste de Levene é preferível quando seus dados podem não seguir uma distribuição normal, pois é robusto à não normalidade. O teste F para igualdade de variâncias é o teste ideal quando a normalidade se mantém, mas sua taxa de erro tipo I pode ser severamente distorcida por dados assimétricos ou de caudas pesadas. Na prática, muitos estatísticos usam o teste de Levene por padrão para evitar esse risco.