Calculadora de hipótese - Z, T e p-valor
Faça testes Z e T para médias e proporções. Insira seus dados amostrais para calcular em segundos a estatística de teste, o p-valor e o valor crítico.
Selecione o tipo de teste e a hipótese alternativa, insira seus dados e clique em Calcular para determinar se deve rejeitar a hipótese nula.
Calculadora de hipótese - Z, T e p-valor
Faça testes Z e T para médias e proporções. Insira seus dados amostrais para calcular em segundos a estatística de teste, o p-valor e o valor crítico.
Sobre a calculadora de hipótese
O teste de hipóteses é a espinha dorsal da estatística inferencial. Ele fornece uma estrutura probabilística e fundamentada para decidir se os dados coletados são consistentes com uma afirmação teórica — a hipótese nula — ou se a evidência é forte o suficiente para rejeitar essa afirmação em favor de uma alternativa. Todo experimento em medicina, psicologia, economia, controle de qualidade em engenharia e testes A/B em sites acaba, no fim, se reduzindo a alguma forma de teste de hipótese.
A hipótese nula (H₀) é a suposição padrão: nada aconteceu, o tratamento não tem efeito, o processo está no alvo ou as proporções não mudaram. A hipótese alternativa (H₁) é o que você está tentando detectar: a média mudou, a proporção mudou ou um tratamento é melhor que outro. O nível de significância α — geralmente 0.05 ou 0.01 — é a probabilidade de rejeitar H₀ incorretamente quando ela é de fato verdadeira (erro do Tipo I). Se o p-valor retornado pelo teste for menor que α, você rejeita H₀.
O teste Z para médias é apropriado quando o desvio padrão populacional σ é conhecido e a amostra é grande (n ≥ 30) ou a população é normalmente distribuída. A estatística é Z = (x̄ − μ₀) / (σ / √n). Como σ é conhecido, a estatística segue exatamente a distribuição normal padrão, e o p-valor é obtido na tabela normal. O teste T para médias é usado quando σ é desconhecido, que é a situação mais realista na maioria das pesquisas. Nesse caso, usa-se o desvio padrão amostral s, e a estatística T = (x̄ − μ₀) / (s / √n) segue uma distribuição t com df = n − 1 graus de liberdade. Em amostras pequenas, a distribuição t tem caudas mais pesadas que a normal, tornando mais difícil alcançar significância — uma penalidade sensata pela incerteza adicional sobre σ.
O teste Z para proporções verifica se uma proporção amostral observada p̂ é consistente com uma proporção populacional hipotetizada p₀. O erro padrão é √(p₀(1 − p₀) / n) e a estatística é Z = (p̂ − p₀) / SE. Esse teste é amplamente usado em testes A/B, endpoints primários de ensaios clínicos e gráficos de controle de fração defeituosa.
Em um teste bicaudal, você rejeita H₀ quando |estatística| > valor crítico, capturando desvios em qualquer direção. Em um teste unicaudal (esquerda ou direita), você especifica a direção com antecedência; isso dá mais poder para detectar uma mudança nessa direção, mas não pode apontar uma mudança inesperada no outro sentido. O valor crítico exibido é o limite da cauda direita; para um teste de cauda esquerda, o limite relevante é seu negativo.
O p-valor é a probabilidade de observar uma estatística de teste pelo menos tão extrema quanto a calculada, assumindo que H₀ é verdadeira. Um p-valor de 0.03 não significa que há 3% de chance de a nula ser verdadeira; significa que, se H₀ fosse verdadeira, haveria apenas 3% de chance de ver dados tão extremos ou mais extremos por amostragem aleatória בלבד. Significância estatística não é o mesmo que significância prática: um efeito pequeno pode ser altamente significativo com n grande, enquanto um efeito grande pode não alcançar significância com n pequeno. Sempre combine o p-valor com tamanho de efeito e intervalo de confiança.
Exemplos de teste de hipóteses
Cenários reais que ilustram cada tipo de teste e direção de cauda.
| Cenário | Resultado | Interpretação |
|---|---|---|
| Controle de qualidade: x̄=10.01mm, μ₀=10mm, σ=0.03, n=50, α=0.05, teste Z bicaudal | Z=2.357, p=0.0184 → Rejeitar H₀ | O diâmetro médio do parafuso mudou significativamente em relação ao alvo de 10 mm; o processo precisa de ajuste. |
| Ensaio de medicamento: x̄=12 mmHg, μ₀=10, s=3, n=30, α=0.05, teste T de cauda direita | T=3.651, df=29, p=0.0005 → Rejeitar H₀ | Há evidência forte de que o medicamento reduz a pressão arterial em mais de 10 mmHg, em média. |
| Teste A/B: p̂=0.095, p₀=0.08, n=1000, α=0.05, teste Z de cauda direita (proporção) | Z=1.750, p=0.0401 → Rejeitar H₀ | O novo design do botão aumenta significativamente a taxa de cliques acima da base de 8%. |
| Eficiência de combustível: x̄=29 mpg, μ₀=30, σ=2, n=40, α=0.01, teste Z de cauda esquerda | Z=−3.162, p=0.0008 → Rejeitar H₀ | Há evidência, no nível de 1%, de que a eficiência do modelo está abaixo dos 30 mpg anunciados. |
Como usar a calculadora de hipótese
- Escolha o tipo de teste: Z (média) se σ for conhecido, T (média) se σ for desconhecido e você tiver um desvio padrão amostral, ou Z (proporção) para resultados categóricos.
- Selecione a direção da hipótese alternativa — bicaudal para detectar qualquer mudança, cauda esquerda para detectar uma queda ou cauda direita para detectar um aumento.
- Digite o valor da hipótese nula (μ₀ para testes de média ou p₀ para testes de proporção), o nível de significância α escolhido (normalmente 0.05) e o tamanho da amostra n.
- Preencha o campo restante: média amostral x̄ e desvio padrão populacional σ para Z (média); média amostral x̄ e desvio padrão amostral s para T; ou proporção amostral p̂ para Z (proporção).
- Clique em Calcular. A ferramenta mostra a estatística de teste, os graus de liberdade (apenas T), o p-valor, o valor crítico e a decisão de rejeitar ou não rejeitar.
Perguntas frequentes sobre teste de hipóteses
Qual é a diferença entre um teste Z e um teste T?
Um teste Z é usado quando o desvio padrão populacional σ é conhecido, o que permite usar a distribuição normal padrão para calcular p-valores exatos. Um teste T é usado quando σ é desconhecido e precisa ser estimado pelo desvio padrão amostral s; a estatística resultante segue uma distribuição t com n−1 graus de liberdade, que tem caudas mais pesadas que a normal para acomodar a incerteza adicional. À medida que o tamanho da amostra cresce, a t converge para a normal, então a distinção importa mais para amostras pequenas (aprox. n < 30).
O que o p-valor realmente significa?
O p-valor é a probabilidade de obter uma estatística de teste pelo menos tão extrema quanto a observada, assumindo que a hipótese nula é verdadeira. Não é a probabilidade de H₀ ser verdadeira, nem a probabilidade de o seu resultado ter acontecido por acaso. Um p-valor abaixo de α (comumente 0.05) significa que os dados observados seriam surpreendentes se H₀ fosse verdadeira, então você rejeita H₀. Um p-valor acima de α significa que os dados são consistentes com H₀, então você não a rejeita — mas isso não prova que H₀ está correta.
Quando devo usar um teste unicaudal em vez de bicaudal?
Use um teste bicaudal quando uma diferença em qualquer direção for cientificamente relevante e você não tiver uma razão forte para esperar uma direção específica. Use um teste unicaudal quando a teoria ou evidências prévias especificarem claramente a direção do efeito antes da coleta de dados. Mudar para um teste unicaudal depois de ver os dados para buscar significância é p-hacking e invalida a análise. Um teste unicaudal com α=0.05 equivale a um teste bicaudal com α=0.10.
O que é o nível de significância α e como devo escolhê-lo?
O nível de significância α é a probabilidade máxima aceitável de um erro do Tipo I — rejeitar incorretamente uma hipótese nula verdadeira. A escolha convencional é 0.05 (5%), mas 0.01 é usado quando falsos positivos são especialmente caros (diagnóstico médico, sistemas críticos de segurança). Algumas áreas agora recomendam reportar p-valores exatos em vez de depender de um limiar fixo, e combiná-los com intervalos de confiança e tamanhos de efeito para uma visão mais completa.
O que são erros do Tipo I e Tipo II?
Um erro do Tipo I (falso positivo) ocorre quando você rejeita H₀ mesmo ela sendo verdadeira; sua probabilidade é α. Um erro do Tipo II (falso negativo) ocorre quando você não rejeita H₀ mesmo ela sendo falsa; sua probabilidade é β, e o poder estatístico é 1−β. Reduzir α torna o critério de rejeição mais rígido, o que diminui erros do Tipo I, mas aumenta os do Tipo II. Aumentar o tamanho da amostra é a forma mais limpa de reduzir ambos ao mesmo tempo.
Posso usar esta calculadora para proporções de pesquisa?
Sim — o modo de Teste Z para Proporção foi feito exatamente para isso. Digite a proporção populacional hipotetizada p₀ (seu valor de referência ou teórico), o tamanho da amostra n e a proporção amostral observada p̂ (sucessos divididos por n). A calculadora aplica a fórmula padrão Z = (p̂ − p₀) / √(p₀(1−p₀)/n). A aproximação normal é confiável quando tanto n·p₀ quanto n·(1−p₀) excedem 5 ou 10.