Wald检验计算器 - 统计显著性
执行Wald检验以判断参数估计是否具有统计显著性——输入 β̂、β₀、SE 和 α 即可立即得到结果。
输入参数估计值、假设值、标准误和显著性水平。计算器会返回Wald统计量、z分数、p值和决策结论。
Wald检验计算器 - 统计显著性
执行Wald检验以判断参数估计是否具有统计显著性——输入 β̂、β₀、SE 和 α 即可立即得到结果。
关于Wald检验计算器
Wald检验是一种参数统计检验,以统计学家Abraham Wald命名。它是极大似然估计中三种经典假设检验之一,另外两种是似然比检验和得分(拉格朗日乘子)检验。Wald检验最为常见,因为它只需要估计值本身及其标准误——这两项通常都会由统计软件报告——而不需要完整的似然函数。
Wald检验背后的思想很直接。如果参数估计值 β̂ 相对于其精度(由标准误 SE 衡量)而言距离假设值 β₀ 很远,那么原假设 H₀: β = β₀ 就不太可能成立。Wald统计量为 W = ((β̂ − β₀) / SE)²,也就是z分数的平方。在原假设成立且样本足够大时,W服从自由度为1的卡方分布。等价地,带符号的z分数 z = (β̂ − β₀) / SE 服从标准正态分布,因此双侧p值为 2 · (1 − Φ(|z|)),其中 Φ 是标准正态分布的累积分布函数。
p值回答的问题是:如果原假设为真,观察到至少像实际计算出的检验统计量一样极端的结果的概率是多少?较小的p值(通常低于显著性水平 α,常设为0.05或0.01)提供了反对 H₀ 的证据。当 p < α 时,结果称为具有统计显著性,我们拒绝原假设。当 p ≥ α 时,我们不拒绝原假设——这表示没有足够证据说明参数不同于 β₀,但并不意味着 H₀ 为真。
Wald检验在应用统计中无处不在。在线性回归和逻辑回归中,为每个系数报告的t统计量本质上就是Wald z分数,相应的p值用于检验各系数是否显著不同于零。在计量经济学中,Wald检验用于同时检验关于多个系数的联合假设(通过矩阵代数扩展)。在生存分析中,它检验某个协变量是否能显著预测风险率。在遗传学中,全基因组关联研究使用Wald型统计量来检验数百万个单核苷酸多态性。
Wald检验的一个已知局限是,它可能会因参数化方式不同而产生不同结果,因为该检验依赖于对似然函数的局部二次近似。对于小样本,通常更偏好似然比检验,因为它更准确。Wald检验在样本量较大、估计值近似服从正态分布(即满足渐近条件)且标准误估计良好时最可靠。
Wald检验示例
来自经济学、医学和一般统计的三个真实场景,展示Wald检验的实际应用。
| 输入 | 决策 | 详情 |
|---|---|---|
| β̂=2.5, β₀=0, SE=1.1, α=0.05 | 拒绝 H₀ | z = 2.27, W = 5.17, p ≈ 0.023。估计值距离零超过2个标准误,因此在 α = 0.05 下拒绝原假设。 |
| β̂=0.08, β₀=0, SE=0.02, α=0.05 | 拒绝 H₀ | 教育系数:z = 4.0, p < 0.001。受教育年限每增加一年,对工资具有高度显著的非零影响。 |
| β̂=−0.5, β₀=0, SE=0.2, α=0.01 | 不拒绝 H₀ | 在严格的 α=0.01 下检验药物疗效:z = −2.5, p ≈ 0.012。该效应在 α=0.05 下显著,但在更严格的1%阈值下不显著。 |
如何使用Wald检验计算器
- 输入来自回归输出或统计模型的参数估计值 β̂。
- 输入假设值 β₀——检验系数是否非零时通常为0。
- 输入估计值的标准误 SE,通常在同一统计输出中报告。
- 设置显著性水平 α——常规5%阈值使用0.05,更严格的1%阈值使用0.01。
- 点击计算,获得Wald统计量、z分数、双侧p值以及拒绝或不拒绝的决策。
Wald检验常见问题
Wald检验衡量什么?
Wald检验衡量参数估计值距离某个假设值有多远,并以标准误为单位表示。它检验在给定显著性水平下,这个距离是否足够大,从而可以认为真实参数不同于假设值。
Wald检验和t检验有什么区别?
在大样本中二者本质上等价——都以标准误为单位比较估计值和原假设值。主要区别在于t检验使用t分布(考虑方差估计的不确定性),而Wald检验使用正态分布,因此是一种最适合大样本的渐近检验。
为什么原假设通常是 β₀ = 0?
与零比较是在询问某个预测变量是否有任何影响。在回归中,系数为零意味着该变量无关。设定 β₀ = 0 是最常见的用法,但你也可以与任何值比较——例如检验参数是否等于理论预测值,如1或−0.5。
不拒绝 H₀ 是什么意思?
不拒绝 H₀ 表示数据没有提供足够证据来断定参数不同于假设值。它并不能证明 H₀ 为真。结果可能反映真实效应为零,也可能是样本较小或标准误较大导致统计功效不足。
什么时候应该改用似然比检验?
当样本量较小、参数接近其允许范围边界,或Wald检验结果强烈依赖所选参数化方式时,更适合使用似然比检验。对于大样本和平滑分布的估计值,Wald检验和似然比检验给出的p值几乎相同。
应该使用什么显著性水平?
常规阈值是 α = 0.05(5%),表示你接受5%的概率错误地拒绝真实的原假设。对于更严格的要求——如医疗器械审批、基因组学或物理学——会使用 α = 0.01 甚至0.001。探索性研究有时接受 α = 0.10。应在查看数据之前确定该选择。