等位基因頻率計算器 - 哈溫平衡工具
根據基因型計數或直接等位基因輸入,計算任何族群的等位基因頻率、基因型頻率與哈溫平衡。
輸入基因型計數(AA、Aa、aa)或直接等位基因計數,即可計算 p、q、預期基因型頻率,以及 HWE 卡方檢定。
等位基因頻率計算器 - 哈溫平衡工具
根據基因型計數或直接等位基因輸入,計算任何族群的等位基因頻率、基因型頻率與哈溫平衡。
關於等位基因頻率計算器
等位基因頻率計算器是一項族群遺傳學工具,可計算用於描述族群內遺傳變異的基本量:每個等位基因的頻率、每種基因型的頻率,以及族群是否處於哈迪-溫伯格平衡(HWE,常稱哈溫平衡)。這些計算對遺傳學與演化生物學課程、臨床遺傳學、保育生物學,以及任何涉及族群層級 DNA 資料的研究都很重要。
等位基因頻率是族群遺傳學中最簡單也最重要的摘要統計量。對於雙等位基因系統——顯性等位基因 A 與隱性等位基因 a——等位基因頻率以 p(A 的頻率)和 q(a 的頻率)表示,且必須滿足 p + q = 1。由基因型計數計算時,p = (2 × AA + Aa) / (2 × N),其中 N 是二倍體個體總數。分母 2N 是族群中的等位基因總數,因為每個二倍體個體帶有兩個拷貝。若由直接等位基因計數計算,則 p = A / (A + a),q = a / (A + a)。
基因型頻率描述族群中帶有三種二倍體基因型類別的比例:AA(顯性同型合子)、Aa(異型合子)與 aa(隱性同型合子)。觀察到的基因型頻率就是各計數除以 N。哈溫平衡下的預期基因型頻率分別為 p²、2pq 與 q²,由哈迪-溫伯格原理預測。
哈迪-溫伯格原理指出,在一個規模大、隨機交配,且沒有突變、遷移、天擇或遺傳漂變的族群中,等位基因與基因型頻率會在世代間保持不變。HWE 下的預期基因型計數為 AA 的 p² × N、Aa 的 2pq × N,以及 aa 的 q² × N。當觀察到的基因型計數與這些預期顯著不同時,該族群可視為偏離 HWE,可能代表近親繁殖、族群分層、作用於該位點的天擇,或實驗室資料中的基因分型錯誤。
卡方檢定提供正式的統計架構,用來判定偏離 HWE 的程度是否大於隨機機率所能預期。檢定統計量是在三個基因型類別中加總 (觀察值 − 預期值)² / 預期值。以一個自由度(2 個等位基因、3 種基因型、1 個限制)來看,p = 0.05 的臨界值為 3.841。卡方值低於 3.841 與 HWE 一致;高於該值則表示具統計顯著性的偏離。
實務應用十分廣泛。在臨床遺傳學中,檢測 SNP 是否符合 HWE 是標準品質管制步驟——控制組基因分型資料中系統性的 HWE 偏離會提示批次效應或基因分型錯誤。在保育生物學中,小型或破碎化族群偏離 HWE 可能表示近交衰退或遺傳瓶頸。在法醫遺傳學中,HWE 假設是計算 DNA 型別隨機相符機率所用乘積法則的基礎。了解疾病相關等位基因的 p 與 q,也能讓流行病學家使用 2pq 公式估計帶因者頻率。
等位基因頻率範例
以真實族群情境展示基因型計數、等位基因頻率與哈溫平衡預期值。
| 族群 | p / q | HWE 評估 |
|---|---|---|
| 50 AA,30 Aa,20 aa (N=100) | p = 0.6500,q = 0.3500 | 預期:AA 42.25,Aa 45.50,aa 12.25。卡方 ≈ 7.14 — 偏離 HWE。 |
| 10 AA,80 Aa,10 aa (N=100) | p = 0.5000,q = 0.5000 | 多為異型合子。預期:AA 25,Aa 50,aa 25。卡方 ≈ 36 — 強烈偏離 HWE(異型合子過多)。 |
| 120 個 A 等位基因,80 個 a 等位基因 | p = 0.6000,q = 0.4000 | 直接等位基因輸入模式。N 估計為 100。預期:AA 36,Aa 48,aa 16。 |
| 3 AA,2 Aa,5 aa (N=10) | p = 0.4000,q = 0.6000 | 小型族群。預期:AA 1.6,Aa 4.8,aa 3.6。樣本數太小會使 HWE 檢定不可靠。 |
如何使用等位基因頻率計算器
- 選擇輸入方式:若有 AA、Aa 和 aa 計數,選擇「基因型計數」;若有每個等位基因的直接計數,選擇「等位基因計數」。
- 基因型計數:輸入顯性同型合子(AA)、異型合子(Aa)與隱性同型合子(aa)個體數。
- 等位基因計數:輸入 A 等位基因與 a 等位基因的數量。也可選填個體總數,以取得按規模換算的 HWE 預期計數。
- 按一下「計算」。工具會顯示 p 與 q、總 N、HWE 下的預期基因型計數,以及(針對基因型輸入)HWE 偏離的卡方檢定。
- 按一下「重設」清除所有欄位並開始新的計算。
等位基因頻率計算器常見問題
遺傳學中的 p 和 q 代表什麼?
在雙等位基因系統中,p 是顯性等位基因(A)的頻率,q 是隱性等位基因(a)的頻率。它們永遠加總為 1(p + q = 1),因為該位點上的每個等位基因都必須是 A 或 a。等位基因頻率範圍從 0(等位基因不存在)到 1(等位基因在族群中固定)。
什麼是哈迪-溫伯格平衡?
哈迪-溫伯格平衡(HWE)描述族群中等位基因與基因型頻率在世代間保持恆定的理論狀態。它需要五個條件:族群規模大、隨機交配、無突變、無遷移,且無天擇。在 HWE 下,預期基因型頻率為 p²(AA)、2pq(Aa)與 q²(aa)。
為什麼我的族群會偏離 HWE?
HWE 偏離的常見原因包括近親繁殖(降低異型合子比例)、族群分層(遺傳上不同的亞族群混合)、該位點受到強烈天擇、近期遷移,或實驗室資料中的基因分型錯誤。同型合子過多暗示近親繁殖;異型合子過多可能表示族群分層或異型合子優勢。
如何解讀 HWE 的卡方檢定?
卡方統計量衡量觀察與預期基因型計數之間的差異。在 1 個自由度下,低於 3.841 的值在 5% 顯著水準下不具統計顯著性(與 HWE 一致)。高於 3.841 的值表示顯著偏離 HWE。請注意,樣本數很小(N < 20)時,卡方近似不可靠,較適合使用精確檢定。
我可以將這個計算器用於 X 連鎖位點嗎?
此處顯示的標準哈迪-溫伯格公式適用於體染色體位點。對 X 連鎖位點而言,男性為半合子(只帶有一個等位基因),因此男性隱性表型的頻率等於 q,而不是 q²。需要另外進行 X 連鎖 HWE 分析,不過由女性基因型計數計算等位基因頻率(p 和 q)時使用相同公式。
常見疾病變異的典型等位基因頻率是多少?
全基因組關聯研究(GWAS)找到的常見疾病相關 SNP,次要等位基因頻率(MAF)通常介於 0.05 到 0.50。罕見孟德爾疾病變異的頻率可能遠低於 0.01(1%)。隱性疾病的帶因者頻率等於 2pq,因此若隱性等位基因 q = 0.01,帶因者頻率約為 2 × 0.99 × 0.01 ≈ 2%。