Calculateur de fréquence allélique - Hardy-Weinberg
Calculez les fréquences alléliques, les fréquences génotypiques et l’équilibre de Hardy-Weinberg de toute population à partir d’effectifs génotypiques ou d’entrées directes d’allèles.
Saisissez des effectifs de génotypes (AA, Aa, aa) ou des effectifs directs d’allèles pour calculer p, q, les fréquences génotypiques attendues et un test du chi carré de HWE.
Calculateur de fréquence allélique - Hardy-Weinberg
Calculez les fréquences alléliques, les fréquences génotypiques et l’équilibre de Hardy-Weinberg de toute population à partir d’effectifs génotypiques ou d’entrées directes d’allèles.
À propos du calculateur de fréquence allélique
Le calculateur de fréquence allélique est un outil de génétique des populations qui calcule les grandeurs fondamentales utilisées pour caractériser la variation génétique au sein d’une population : la fréquence de chaque allèle, la fréquence de chaque génotype et le fait que la population soit ou non en équilibre de Hardy-Weinberg (HWE). Ces calculs sont essentiels pour les cours de génétique et de biologie évolutive, la génétique clinique, la biologie de la conservation et toute recherche portant sur des données d’ADN à l’échelle d’une population.
La fréquence allélique est la statistique synthétique la plus simple et la plus importante en génétique des populations. Pour un système à deux allèles — l’allèle dominant A et l’allèle récessif a — les fréquences alléliques sont notées p (fréquence de A) et q (fréquence de a), avec l’exigence p + q = 1. À partir d’effectifs génotypiques, p = (2 × AA + Aa) / (2 × N), où N est le nombre total d’individus diploïdes. Le dénominateur 2N est le nombre total d’allèles dans la population, car chaque individu diploïde porte deux copies. À partir d’effectifs alléliques directs, p = A / (A + a) et q = a / (A + a).
Les fréquences génotypiques décrivent la fraction de la population portant chacune des trois classes de génotypes diploïdes : AA (homozygote dominant), Aa (hétérozygote) et aa (homozygote récessif). Les fréquences génotypiques observées sont simplement les effectifs divisés par N. Les fréquences génotypiques attendues sous l’équilibre de Hardy-Weinberg sont respectivement p², 2pq et q², comme le prédit le principe de Hardy-Weinberg.
Le principe de Hardy-Weinberg stipule que, dans une grande population à accouplement aléatoire sans mutation, migration, sélection naturelle ni dérive génétique, les fréquences alléliques et génotypiques restent constantes de génération en génération. Les effectifs génotypiques attendus sous HWE sont p² × N pour AA, 2pq × N pour Aa et q² × N pour aa. Lorsque les effectifs génotypiques observés diffèrent significativement de ces attentes, on dit que la population est hors HWE, ce qui peut signaler une consanguinité, une stratification de population, une sélection naturelle agissant sur le locus ou une erreur de génotypage dans les données de laboratoire.
Le test du chi carré fournit un cadre statistique formel pour décider si les écarts par rapport à HWE sont plus importants que ce qui serait attendu par hasard. La statistique de test est la somme de (observé − attendu)² / attendu sur les trois classes génotypiques. Avec un degré de liberté (2 allèles, 3 génotypes, 1 contrainte), la valeur critique à p = 0.05 est 3.841. Une valeur de chi carré inférieure à 3.841 est compatible avec HWE ; une valeur supérieure indique un écart statistiquement significatif.
Les applications pratiques sont nombreuses. En génétique clinique, tester un SNP pour HWE est une étape standard de contrôle qualité : un écart systématique à HWE dans les données de génotypage des témoins signale des effets de lot ou des erreurs de génotypage. En biologie de la conservation, un écart à HWE dans des populations petites ou fragmentées peut indiquer une dépression de consanguinité ou des goulots d’étranglement génétiques. En génétique médico-légale, les hypothèses de HWE sous-tendent la règle du produit utilisée pour calculer la probabilité de correspondance aléatoire d’un profil ADN. Comprendre p et q pour les allèles associés à des maladies permet aussi aux épidémiologistes d’estimer les fréquences de porteurs avec la formule 2pq.
Exemples de fréquence allélique
Scénarios réels de population montrant les effectifs génotypiques, les fréquences alléliques et les attentes de Hardy-Weinberg.
| Population | p / q | Évaluation HWE |
|---|---|---|
| 50 AA, 30 Aa, 20 aa (N=100) | p = 0.6500, q = 0.3500 | Attendu : AA 42.25, Aa 45.50, aa 12.25. Chi carré ≈ 7.14 — écart à HWE. |
| 10 AA, 80 Aa, 10 aa (N=100) | p = 0.5000, q = 0.5000 | Majorité d’hétérozygotes. Attendu : AA 25, Aa 50, aa 25. Chi carré ≈ 36 — fortement hors HWE (excès d’hétérozygotes). |
| 120 allèles A, 80 allèles a | p = 0.6000, q = 0.4000 | Mode de saisie directe des allèles. N estimé à 100. Attendu : AA 36, Aa 48, aa 16. |
| 3 AA, 2 Aa, 5 aa (N=10) | p = 0.4000, q = 0.6000 | Petite population. Attendu : AA 1.6, Aa 4.8, aa 3.6. Les petits échantillons rendent le test HWE peu fiable. |
Comment utiliser le calculateur de fréquence allélique
- Choisissez votre méthode de saisie : « Effectifs génotypiques » si vous avez les effectifs AA, Aa et aa, ou « Effectifs alléliques » si vous avez les effectifs directs de chaque allèle.
- Pour les effectifs génotypiques : saisissez le nombre d’individus homozygotes dominants (AA), hétérozygotes (Aa) et homozygotes récessifs (aa).
- Pour les effectifs alléliques : saisissez le nombre d’allèles A et d’allèles a. Vous pouvez aussi saisir le nombre total d’individus afin d’obtenir des effectifs attendus HWE mis à l’échelle.
- Cliquez sur Calculer. L’outil affiche p et q, le N total, les effectifs génotypiques attendus sous HWE et (pour une entrée par génotypes) un test du chi carré de l’écart à HWE.
- Cliquez sur Réinitialiser pour effacer tous les champs et démarrer un nouveau calcul.
FAQ du calculateur de fréquence allélique
Que représentent p et q en génétique ?
Dans un système à deux allèles, p est la fréquence de l’allèle dominant (A) et q la fréquence de l’allèle récessif (a). Leur somme est toujours égale à 1 (p + q = 1), car chaque allèle au locus doit être soit A, soit a. Les fréquences alléliques vont de 0 (allèle absent) à 1 (allèle fixé dans la population).
Qu’est-ce que l’équilibre de Hardy-Weinberg ?
L’équilibre de Hardy-Weinberg (HWE) décrit l’état théorique d’une population où les fréquences alléliques et génotypiques restent constantes au fil des générations. Il exige cinq conditions : grande taille de population, accouplement aléatoire, absence de mutation, absence de migration et absence de sélection naturelle. Sous HWE, les fréquences génotypiques attendues sont p² (AA), 2pq (Aa) et q² (aa).
Pourquoi ma population peut-elle s’écarter de HWE ?
Les causes courantes d’écart à HWE incluent la consanguinité (qui réduit l’hétérozygotie), la stratification de population (mélange de sous-populations génétiquement distinctes), une forte sélection naturelle sur le locus, une migration récente ou des erreurs de génotypage dans les données de laboratoire. Un excès d’homozygotie suggère une consanguinité ; un excès d’hétérozygotie peut indiquer une stratification de population ou un avantage de l’hétérozygote.
Comment interpréter le test du chi carré pour HWE ?
La statistique du chi carré mesure la différence entre les effectifs génotypiques observés et attendus. Avec 1 degré de liberté, une valeur inférieure à 3.841 n’est pas statistiquement significative au seuil de 5 % (compatible avec HWE). Une valeur supérieure à 3.841 indique un écart significatif à HWE. Notez qu’avec de très petits échantillons (N < 20), l’approximation du chi carré n’est pas fiable et un test exact est préférable.
Puis-je utiliser ce calculateur pour des loci liés à l’X ?
Les formules standard de Hardy-Weinberg présentées ici s’appliquent aux loci autosomiques. Pour les loci liés à l’X, les hommes sont hémizygotes (ils ne portent qu’un seul allèle), de sorte que la fréquence du phénotype récessif chez les hommes est q plutôt que q². Une analyse HWE liée à l’X séparée est nécessaire, même si le calcul de la fréquence allélique (p et q) à partir des génotypes féminins utilise la même formule.
Quelle est la fréquence allélique typique d’une variante courante de maladie ?
Les SNP courants associés à des maladies identifiés par les études d’association pangénomique (GWAS) ont souvent des fréquences de l’allèle mineur (MAF) comprises entre 0.05 et 0.50. Les variantes rares de maladies mendéliennes peuvent avoir des fréquences bien inférieures à 0.01 (1 %). La fréquence des porteurs d’une maladie récessive est égale à 2pq ; ainsi, pour un allèle récessif avec q = 0.01, la fréquence des porteurs est d’environ 2 × 0.99 × 0.01 ≈ 2 %.