Calculateur de test d'hypothèse - Z, T et p-valeur

Réalisez des tests Z et T pour les moyennes et les proportions. Saisissez vos données d'échantillon pour calculer en quelques secondes la statistique de test, la p-valeur et la valeur critique.

Sélectionnez le type de test et l'hypothèse alternative, saisissez vos données, puis cliquez sur Calculer pour déterminer s'il faut rejeter l'hypothèse nulle.

Calculateur de test d'hypothèse - Z, T et p-valeur
Réalisez des tests Z et T pour les moyennes et les proportions. Saisissez vos données d'échantillon pour calculer en quelques secondes la statistique de test, la p-valeur et la valeur critique.

À propos du calculateur de test d'hypothèse

Le test d'hypothèse est le pilier des statistiques inférentielles. Il fournit un cadre probabiliste et rigoureux pour décider si les données recueillies sont compatibles avec une affirmation théorique — l'hypothèse nulle — ou si les preuves sont suffisamment fortes pour la rejeter au profit d'une alternative. Chaque expérience en médecine, psychologie, économie, contrôle qualité en ingénierie et test A/B de sites web se ramène finalement à une forme de test d'hypothèse. L'hypothèse nulle (H₀) est l'hypothèse par défaut : rien ne s'est passé, le traitement n'a pas d'effet, le procédé est conforme à la cible, ou les proportions sont inchangées. L'hypothèse alternative (H₁) est ce que vous cherchez à détecter : la moyenne a changé, la proportion a évolué, ou un traitement est meilleur qu'un autre. Le niveau de signification α — généralement 0.05 ou 0.01 — est la probabilité de rejeter à tort H₀ alors qu'elle est vraie (erreur de type I). Si la p-valeur renvoyée par le test est inférieure à α, vous rejetez H₀. Le test Z pour les moyennes est approprié lorsque l'écart-type de population σ est connu et que l'échantillon est grand (n ≥ 30) ou que la population est normalement distribuée. La statistique est Z = (x̄ − μ₀) / (σ / √n). Comme σ est connu, la statistique suit exactement la loi normale centrée réduite, et la p-valeur se lit dans la table de la normale. Le test T pour les moyennes s'applique lorsque σ est inconnu, ce qui est la situation la plus réaliste dans la plupart des recherches. On utilise alors l'écart-type de l'échantillon s, et la statistique T = (x̄ − μ₀) / (s / √n) suit une loi t avec df = n − 1 degrés de liberté. Avec de petits échantillons, la loi t a des queues plus épaisses que la normale, ce qui rend la significativité plus difficile à atteindre — une pénalité raisonnable pour l'incertitude supplémentaire sur σ. Le test Z pour les proportions vérifie si une proportion d'échantillon observée p̂ est compatible avec une proportion de population hypothétisée p₀. L'erreur standard est √(p₀(1 − p₀) / n) et la statistique est Z = (p̂ − p₀) / SE. Ce test est largement utilisé dans les tests A/B, les critères principaux des essais cliniques et les cartes de contrôle des proportions de non-conformes. Pour un test bilatéral, vous rejetez H₀ lorsque |statistique| > valeur critique, ce qui capture les écarts dans les deux directions. Pour un test unilatéral (gauche ou droite), vous spécifiez la direction à l'avance ; cela donne plus de puissance pour détecter une variation dans cette direction, mais ne peut pas signaler un changement inattendu dans l'autre sens. La valeur critique affichée correspond à la borne de queue droite ; pour un test de queue gauche, la borne pertinente est son opposé. La p-valeur est la probabilité d'observer une statistique de test au moins aussi extrême que celle calculée, en supposant H₀ vraie. Une p-valeur de 0.03 ne signifie pas qu'il y a 3% de chances que l'hypothèse nulle soit vraie ; cela signifie que si H₀ était vraie, il n'y aurait que 3% de chances d'observer des données aussi extrêmes ou plus extrêmes par le seul effet de l'échantillonnage aléatoire. La significativité statistique n'est pas la même chose que la significativité pratique : un effet minime peut être hautement significatif avec un grand n, tandis qu'un effet important peut ne pas atteindre la significativité avec un petit n. Associez toujours la p-valeur à une taille d'effet et à un intervalle de confiance.

Exemples de tests d'hypothèse

Scénarios réels illustrant chaque type de test et chaque direction de queue.

ScénarioRésultatInterprétation
Contrôle qualité : x̄=10.01mm, μ₀=10mm, σ=0.03, n=50, α=0.05, test Z bilatéralZ=2.357, p=0.0184 → Rejeter H₀Le diamètre moyen des boulons s'est significativement déplacé par rapport à la cible de 10 mm ; le procédé doit être ajusté.
Essai médicamenteux : x̄=12 mmHg, μ₀=10, s=3, n=30, α=0.05, test T à droiteT=3.651, df=29, p=0.0005 → Rejeter H₀Preuve solide que le médicament réduit en moyenne la pression artérielle de plus de 10 mmHg.
Test A/B : p̂=0.095, p₀=0.08, n=1000, α=0.05, test Z à droite (proportion)Z=1.750, p=0.0401 → Rejeter H₀Le nouveau design du bouton augmente significativement le taux de clics au-dessus de la base de 8%.
Consommation de carburant : x̄=29 mpg, μ₀=30, σ=2, n=40, α=0.01, test Z à gaucheZ=−3.162, p=0.0008 → Rejeter H₀Preuve au niveau de 1% que la consommation du modèle est inférieure aux 30 mpg annoncés.

Comment utiliser le calculateur de test d'hypothèse

  1. Choisissez le type de test : Z (moyenne) si σ est connu, T (moyenne) si σ est inconnu et que vous disposez d'un écart-type d'échantillon, ou Z (proportion) pour des résultats catégoriels.
  2. Sélectionnez la direction de l'hypothèse alternative : bilatéral pour détecter tout changement, queue gauche pour une diminution, ou queue droite pour une augmentation.
  3. Entrez la valeur de l'hypothèse nulle (μ₀ pour les tests de moyenne ou p₀ pour les tests de proportion), le niveau de signification α choisi (généralement 0.05) et la taille d'échantillon n.
  4. Renseignez le champ restant : moyenne de l'échantillon x̄ et écart-type de la population σ pour Z (moyenne) ; moyenne de l'échantillon x̄ et écart-type de l'échantillon s pour T ; ou proportion de l'échantillon p̂ pour Z (proportion).
  5. Cliquez sur Calculer. L'outil affiche la statistique de test, les degrés de liberté (T uniquement), la p-valeur, la valeur critique et la décision de rejet ou de non-rejet.

FAQ sur le test d'hypothèse

Quelle est la différence entre un test Z et un test T ?
Un test Z est utilisé lorsque l'écart-type de population σ est connu, ce qui permet d'utiliser la loi normale centrée réduite pour calculer des p-valeurs exactes. Un test T est utilisé lorsque σ est inconnu et doit être estimé à partir de l'écart-type d'échantillon s ; la statistique suit alors une loi t avec n−1 degrés de liberté, qui a des queues plus épaisses que la normale pour tenir compte de l'incertitude supplémentaire. À mesure que la taille d'échantillon augmente, la loi t converge vers la normale ; la distinction est donc surtout importante pour les petits échantillons (environ n < 30).
Que signifie réellement la p-valeur ?
La p-valeur est la probabilité d'obtenir une statistique de test au moins aussi extrême que celle observée, en supposant l'hypothèse nulle vraie. Ce n'est pas la probabilité que H₀ soit vraie, ni la probabilité que votre résultat soit dû au hasard. Une p-valeur inférieure à α (souvent 0.05) signifie que les données observées seraient surprenantes si H₀ était vraie, donc vous rejetez H₀. Une p-valeur supérieure à α signifie que les données sont compatibles avec H₀, donc vous ne la rejetez pas — mais cela ne prouve pas que H₀ est correcte.
Quand faut-il utiliser un test unilatéral plutôt qu'un test bilatéral ?
Utilisez un test bilatéral lorsqu'une différence dans l'une ou l'autre direction est scientifiquement pertinente et que vous n'avez pas de raison forte d'attendre une direction précise. Utilisez un test unilatéral lorsque la théorie ou des preuves antérieures spécifient clairement la direction de l'effet avant la collecte des données. Passer à un test unilatéral après avoir vu les données pour obtenir la significativité est du p-hacking et invalide l'analyse. Un test unilatéral à α=0.05 équivaut à un test bilatéral à α=0.10.
Qu'est-ce que le niveau de signification α et comment le choisir ?
Le niveau de signification α est la probabilité maximale acceptable d'une erreur de type I — rejeter à tort une hypothèse nulle vraie. Le choix conventionnel est 0.05 (5%), mais on utilise 0.01 lorsque les faux positifs sont particulièrement coûteux (diagnostic médical, systèmes critiques de sécurité). Certains domaines recommandent désormais de rapporter les p-valeurs exactes plutôt que de s'appuyer sur un seuil fixe, et de les combiner à des intervalles de confiance et à des tailles d'effet pour une vision plus complète.
Que sont les erreurs de type I et de type II ?
Une erreur de type I (faux positif) se produit lorsque vous rejetez H₀ alors qu'elle est vraie ; sa probabilité est α. Une erreur de type II (faux négatif) se produit lorsque vous ne rejetez pas H₀ alors qu'elle est fausse ; sa probabilité est β, et la puissance statistique est 1−β. Réduire α resserre le critère de rejet, ce qui diminue les erreurs de type I mais augmente les erreurs de type II. Augmenter la taille d'échantillon est le moyen le plus propre de réduire les deux simultanément.
Puis-je utiliser ce calculateur pour des proportions d'enquête ?
Oui — le mode Test Z pour proportion est conçu exactement pour cela. Entrez la proportion de population hypothétisée p₀ (votre valeur de référence ou théorique), votre taille d'échantillon n et la proportion d'échantillon observée p̂ (succès divisés par n). Le calculateur applique la formule standard Z = (p̂ − p₀) / √(p₀(1−p₀)/n). L'approximation normale est fiable lorsque n·p₀ et n·(1−p₀) dépassent tous deux 5 ou 10.