Wald檢定計算器 - 統計顯著性

執行Wald檢定以判斷參數估計是否具有統計顯著性——輸入 β̂、β₀、SE 與 α 即可立即取得結果。

輸入參數估計值、假設值、標準誤與顯著水準。計算器會回傳Wald統計量、z分數、p值與決策結論。

Wald檢定計算器 - 統計顯著性
執行Wald檢定以判斷參數估計是否具有統計顯著性——輸入 β̂、β₀、SE 與 α 即可立即取得結果。

關於Wald檢定計算器

Wald檢定是一種參數統計檢定,以統計學家Abraham Wald命名。它是極大概似估計中三種經典假設檢定之一,另外兩種是概似比檢定與分數(拉格朗日乘數)檢定。Wald檢定最為常見,因為它只需要估計值本身及其標準誤——這兩項通常都會由統計軟體報告——而不需要完整的概似函數。 Wald檢定背後的想法很直接。如果參數估計值 β̂ 相對於其精確度(由標準誤 SE 衡量)而言距離假設值 β₀ 很遠,那麼虛無假設 H₀: β = β₀ 就不太可能成立。Wald統計量為 W = ((β̂ − β₀) / SE)²,也就是z分數的平方。在虛無假設成立且樣本足夠大時,W服從自由度為1的卡方分布。等價地,帶正負號的z分數 z = (β̂ − β₀) / SE 服從標準常態分布,因此雙尾p值為 2 · (1 − Φ(|z|)),其中 Φ 是標準常態分布的累積分布函數。 p值回答的問題是:如果虛無假設為真,觀察到至少像實際計算出的檢定統計量一樣極端的結果,其機率是多少?較小的p值(通常低於顯著水準 α,常設為0.05或0.01)提供了反對 H₀ 的證據。當 p < α 時,結果稱為具有統計顯著性,我們拒絕虛無假設。當 p ≥ α 時,我們不拒絕虛無假設——這表示沒有足夠證據推論參數不同於 β₀,但並不代表 H₀ 為真。 Wald檢定在應用統計中非常普遍。線性迴歸與邏輯斯迴歸中,針對每個係數報告的t統計量本質上就是Wald z分數,相應的p值用於檢定各係數是否顯著不同於零。在計量經濟學中,Wald檢定用於同時檢定關於多個係數的聯合假設(透過矩陣代數擴展)。在存活分析中,它檢定某個共變量是否能顯著預測風險率。在遺傳學中,全基因組關聯研究使用Wald型統計量來檢定數百萬個單核苷酸多型性。 Wald檢定的一個已知限制是,它可能會因參數化方式不同而產生不同結果,因為該檢定依賴對概似函數的局部二次近似。對於小樣本,通常較偏好概似比檢定,因為它更準確。Wald檢定在樣本量較大、估計值近似服從常態分布(亦即滿足漸近條件)且標準誤估計良好時最可靠。

Wald檢定範例

來自經濟學、醫學與一般統計的三個真實情境,展示Wald檢定的實際應用。

輸入決策詳細資料
β̂=2.5, β₀=0, SE=1.1, α=0.05拒絕 H₀z = 2.27, W = 5.17, p ≈ 0.023。估計值距離零超過2個標準誤,因此在 α = 0.05 下拒絕虛無假設。
β̂=0.08, β₀=0, SE=0.02, α=0.05拒絕 H₀教育係數:z = 4.0, p < 0.001。受教育年限每增加一年,對工資具有高度顯著的非零影響。
β̂=−0.5, β₀=0, SE=0.2, α=0.01不拒絕 H₀在嚴格的 α=0.01 下檢定藥物療效:z = −2.5, p ≈ 0.012。該效果在 α=0.05 下顯著,但在更嚴格的1%門檻下不顯著。

如何使用Wald檢定計算器

  1. 輸入來自迴歸輸出或統計模型的參數估計值 β̂。
  2. 輸入假設值 β₀——檢定係數是否非零時通常為0。
  3. 輸入估計值的標準誤 SE,通常在同一份統計輸出中報告。
  4. 設定顯著水準 α——傳統5%門檻使用0.05,更嚴格的1%門檻使用0.01。
  5. 點擊計算,取得Wald統計量、z分數、雙尾p值,以及拒絕或不拒絕的決策。

Wald檢定常見問題

Wald檢定衡量什麼?
Wald檢定衡量參數估計值距離某個假設值有多遠,並以標準誤為單位表示。它檢定在給定顯著水準下,這個距離是否足夠大,足以推論真實參數不同於假設值。
Wald檢定和t檢定有什麼不同?
在大樣本中二者本質上等價——都以標準誤為單位比較估計值與虛無值。主要差異在於t檢定使用t分布(考慮變異數估計的不確定性),而Wald檢定使用常態分布,因此是一種最適合大樣本的漸近檢定。
為什麼虛無假設通常是 β₀ = 0?
與零比較是在詢問某個預測變數是否有任何效果。在迴歸中,係數為零代表該變數無關。設定 β₀ = 0 是最常見的用法,但你也可以與任何值比較——例如檢查參數是否等於理論預測值,如1或−0.5。
不拒絕 H₀ 是什麼意思?
不拒絕 H₀ 表示資料沒有提供足夠證據來推論參數不同於假設值。它並不能證明 H₀ 為真。結果可能反映真實效果為零,也可能是樣本較小或標準誤較大導致統計檢定力不足。
什麼時候應該改用概似比檢定?
當樣本量較小、參數接近其允許範圍邊界,或Wald檢定結果高度依賴所選參數化方式時,較適合使用概似比檢定。對於大樣本和平滑分布的估計值,Wald檢定與概似比檢定給出的p值幾乎相同。
應該使用什麼顯著水準?
傳統門檻是 α = 0.05(5%),表示你接受5%的機率錯誤拒絕真實的虛無假設。對於更嚴格的要求——如醫療器材核准、基因體學或物理學——會使用 α = 0.01 甚至0.001。探索性研究有時接受 α = 0.10。這項選擇應在查看資料之前決定。