Fisher的精确检验计算器 - 2x2列联表

使用Fisher精确检验计算2×2列联表的单尾和双尾p值以及优势比,适合小样本。

输入2×2表(分组 × 结果)的四个单元格计数,然后点击“计算”获取精确p值和优势比。

Fisher精确检验
分析2×2列联表的统计显著性
结果1结果2
组1
组2

关于Fisher精确检验

Fisher精确检验是一种用于分析2×2列联表的统计显著性检验,由 Ronald A. Fisher 爵士于1922年提出。该检验用于判断两个分类变量之间是否存在非随机关联,例如治疗组与患者结局之间的关系。与卡方检验不同,后者只是近似方法,在期望单元格计数较小时会变得不准确,Fisher精确检验使用超几何分布计算观测数据(以及所有更极端配置)的精确概率。 该检验将数据排列成一个边际总计固定(行和与列和)的2×2表。给定这些边际,检验会在无关联的原假设下计算观测排列的概率。单个表 [a, b; c, d] 的概率由超几何公式给出:P = C(a+b, a) × C(c+d, c) / C(n, a+c),其中 n = a+b+c+d。p值通过对所有至少与观测表一样极端的表的概率求和得到。 对于单尾p值,“极端”指的是与观测结果方向一致的表。对于双尾p值——这适用于大多数研究问题——“极端”指的是概率等于或小于观测表的表,并在两个尾部上求和。因此,双尾p值更保守,也更常用于正式发表的研究。 优势比用于量化关联强度:OR = (a × d) / (b × c)。优势比为1表示无关联;大于1表示组1中的结果1比组2更可能;小于1表示相反。优势比是病例对照研究、临床试验和遗传关联研究中的关键指标。 当2×2表中任何单元格的期望计数低于5时,Fisher精确检验都适用,这也是卡方近似变得不可靠的阈值。常见应用包括比较两组治疗成功率的临床试验、检验等位基因是否与疾病相关的遗传流行病学研究、比较两种教学方法及格/不及格率的教育研究,以及比较两种广告变体转化率的营销分析。该检验与样本量无关地给出精确结果,因此是这些领域中小样本分析的黄金标准。

Fisher精确检验 — 示例

三个真实场景,展示如何建立2×2列联表并解读精确p值。

表 [a, b; c, d]双尾p值背景
a=9, b=1, c=2, d=8 (n=20)p = 0.0350(显著)新药试验:10名接受治疗的患者中有9名好转,而安慰剂组10名中有2名好转。治疗与改善之间的关联具有统计显著性。
a=7, b=3, c=1, d=12 (n=23)p = 0.0189(显著)遗传学:10名携带该基因变异者中有7人患病,而13名未携带者中只有1人患病。该基因与疾病显著相关。
a=10, b=2, c=5, d=8 (n=25)p = 0.0840(在 0.05 水平下不显著)教学方法:方法A下12名学生中有10名通过,方法B下13名学生中有5名通过。该差异在5%水平下不显著。
a=4, b=100, c=0, d=110 (n=214)p = 0.0563(边缘)广告A/B测试:每个广告约110次曝光中,广告A带来4次转化,而广告B为0次。结果处于临界状态,值得进行更大样本的后续研究。

如何使用Fisher精确检验计算器

  1. 将数据整理成2×2列联表:行是两个组(组1和组2),列是两个可能结果(结果1和结果2)。
  2. 输入每个单元格的计数:单元格A(组1,结果1)、单元格B(组1,结果2)、单元格C(组2,结果1)、单元格D(组2,结果2)。所有值都必须是非负整数。
  3. 点击“计算”。计算器会枚举所有与边际总计相同的可能2×2表,并对超几何概率求和,得到精确的单尾和双尾p值。
  4. 对于大多数研究问题,请查看双尾p值。如果 p < 0.05,则两组与两个结果之间的关联具有统计显著性。
  5. 解释优势比:大于1表示组1中的结果1更可能;小于1表示其可能性更低。可使用表格下方的示例按钮查看该检验在真实场景中的应用。

Fisher精确检验 — 常见问题

什么时候应使用 Fisher 精确检验而不是卡方检验?
当2×2表中任何一个单元格的期望计数低于5,或总体样本量较小时(n < 20 是常见经验法则),应使用 Fisher 精确检验。卡方检验依赖近似,在小计数下会失效,导致p值不可靠。Fisher检验始终是精确的,因此适用于任何样本量。
Fisher 检验中的双尾 p 值是什么意思?
双尾p值是在原假设“无关联”为真的前提下,在任一方向上观察到与当前表一样极端或更极端结果的概率。这里的“极端”指超几何概率与观测表一样小或更小。按惯例,p值 < 0.05 表示关联具有统计显著性。
什么是优势比,如何解读?
优势比(OR)= (a × d) / (b × c)。OR 为1表示两个组中结果1的发生概率相同,即无关联。OR > 1表示组1中的结果1比组2更可能;OR < 1表示更不可能。例如,OR = 9 表示组1中结果1的优势是组2的9倍,说明存在很强的正向关联。
单尾 p 值和双尾 p 值有什么区别?
单尾p值检验某个特定方向的关联(例如组1中结果1的发生率高于组2)。双尾p值则检验任何方向的关联。除非在看数据之前就已有明确的方向性假设,否则应选择双尾p值,它更合适也更保守。
什么是边际总计,为什么必须固定?
边际总计是表中的行和(a+b 和 c+d)以及列和(a+c 和 b+d)。Fisher检验以这些总计固定为条件,这是推导精确超几何分布的基础。在实践中,边际通常由研究设计决定(例如预先确定的组规模或事件总数)。
Fisher 精确检验能用于大于 2×2 的表吗?
经典的 Fisher 精确检验定义于2×2表。更大 r×c 列联表的推广版本是存在的(使用多维超几何分布),但计算成本很高。对于期望计数较小的大表,可以对2×2子表使用精确检验,或者在统计软件中使用基于蒙特卡洛模拟的精确检验。