Wilcoxon符号秩检验计算器(配对样本)

使用非参数Wilcoxon符号秩检验比较两个相关样本或重复测量。无需正态性假设,即可获得W统计量、Z分数和p值。

请输入成对的前后测量值,以逗号分隔。两个样本必须具有相同数量的数值。

Wilcoxon符号秩检验计算器(配对样本)
使用非参数Wilcoxon符号秩检验比较两个相关样本或重复测量。无需正态性假设,即可获得W统计量、Z分数和p值。

关于Wilcoxon符号秩检验

Wilcoxon符号秩检验是一种非参数统计假设检验,用于比较两个相关样本或同一组对象的重复测量。它是配对 t 检验的非参数对应方法,适用于各对之间差值的正态性假设无法成立的情况。 该检验由 Frank Wilcoxon 于 1945 年提出,特别适合临床试验和行为科学研究,因为同一受试者常常在干预前后接受测量。与直接使用原始数值不同,该检验先对配对观测值的绝对差进行排序,再分别汇总正差和负差对应的秩。 计算过程如下。对每一对数据,先计算差值 d =(后 − 前)。差值为 0 的配对会被排除。将绝对差从小到大排序,遇到并列时取平均秩。正差的秩和记为 W⁺,负差的秩和记为 W⁻。检验统计量 W 取 W⁺ 和 W⁻ 中较小的那个。 对于较大的样本(通常 n ≥ 10),W 的分布可用正态分布近似。Z 分数根据零假设下 W 的均值和标准差计算而得。其均值为 n(n+1)/4,标准差为 √[n(n+1)(2n+1)/24],其中 n 为非零差值的个数。 零假设认为配对观测之间的中位数差为 0——处理没有影响。备择假设可以是双尾(中位数差不为 0),也可以是单尾(差值为正或为负)。本计算器报告双尾 p 值,这是最保守的选择。 当 p 值低于 0.05 时,通常认为配对测量之间存在显著差异。在血压研究中,这可能表示某种药物显著降低了收缩压;在心理学研究中,则可能说明某个疗法显著降低了焦虑评分。 该检验要求观测值必须成对对应——样本1中的每个观测值都必须对应样本2中的一个特定观测值(同一受试者在不同时点,或经过匹配的受试者)。各配对之间必须彼此独立,且差值应来自对称分布,但不必是正态分布。 与配对 t 检验相比,Wilcoxon符号秩检验对离群值和非正态分布更稳健,但当正态性假设成立时,检验力会略低一些。对于小样本、序数结果或存在极端值的数据,它通常是更推荐的选择。

实际示例

通过这些示例了解计算器如何处理不同的配对数据集。

输入输出说明
前: 140,135,150,160,130,145,155,138,148,152 — 后: 132,130,142,151,125,137,145,130,140,148W=0, Z≈−2.80, p≈0.005血压药物——所有差值均为负,说明明显下降。
前: 8,7,6,9,8,7,8,9 — 后: 6,5,5,7,6,6,7,7W=0, Z≈−2.52, p≈0.012治疗后的焦虑评分——在 α = 0.05 水平上显著改善。
前: 75,80,82,79,88,90,76,85,89,92,78,84 — 后: 80,85,85,83,90,94,81,88,92,95,81,89W=0, Z≈+3.06, p≈0.002新教学方法前后学生成绩——提升显著。

如何使用计算器

  1. 在样本1字段中输入治疗前(或基线)测量值,并用逗号分隔。
  2. 在样本2字段中输入对应的治疗后测量值。两个样本必须具有完全相同的数值数量。
  3. 点击计算,求出差值、进行排序,并得到 W 统计量、Z 分数和 p 值。
  4. p 值低于 0.05(以红色显示)表示两种条件之间存在统计学显著差异。
  5. 使用示例按钮可快速加载真实数据集,并用已知结果验证计算器。

常见问题

Wilcoxon符号秩检验和配对 t 检验有什么区别?
两者都用于比较配对测量,但配对 t 检验假设差值服从正态分布。Wilcoxon符号秩检验不作此假设,因此更适合小样本、序数数据或含有明显离群值的数据。在正态性成立时,t 检验的检验力略高。
差值为 0 的配对会怎样处理?
前后数值完全相同(差值 = 0)的配对会从分析中剔除。用于计算检验统计量和 p 值的有效样本量 n 只统计非零差值。这是大多数统计教材中推荐的标准做法。
如何处理并列差值?
当多个配对产生相同的绝对差值时,它们会获得本应占据的秩的平均值。例如,3 个配对若 |d| = 5,并且原本应占第 4、5、6 名,则每个都记为 5 秩。这个中秩修正可保持 Z 近似的有效性。
为什么这个计算器只报告双尾 p 值?
双尾检验最保守,也是大多数探索性研究的默认选择。它检验中位数差是否在任一方向上偏离 0。对于单向假设(例如治疗总是改善结果),可以将报告的双尾 p 值减半,得到单尾 p 值。
样本需要多大,Z 近似才算有效?
通常在 n ≥ 10(剔除零差值后)时,W 统计量的正态近似就比较可靠。样本更小时,应参考 Wilcoxon 表中的精确临界值。此计算器采用正态近似,因此当 n < 10 时需谨慎解读。