Question 1

什么是四分位距（IQR）？

Accepted Answer

四分位距是第三四分位数（Q3，第75百分位数）与第一四分位数（Q1，第25百分位数）之间的差：IQR = Q3 − Q1。它表示数据中间50%的分散范围。由于它忽略最高和最低各25%的数值，IQR不受极端离群值影响，因此当数据偏斜或包含异常值时，它比全距或标准差更稳健。

Question 2

Q1和Q3是如何计算的？

Accepted Answer

计算器对排序后的数据使用线性插值。对于Q1，其位置是在零索引排序数组中的0.25 × (n−1)。如果该位置不是整数，就在相邻两个数据点之间插值。Q3使用同样方法，位置为0.75 × (n−1)。这与R（type 7）和Excel的QUARTILE.INC函数所用方法相同。

Question 3

1.5×IQR规则如何识别离群值？

Accepted Answer

John Tukey的1.5×IQR规则定义下围栏 = Q1 − 1.5×IQR，上围栏 = Q3 + 1.5×IQR。任何落在这些围栏之外的数据点都是潜在离群值。选择1.5这个倍数，是因为对于完全正态分布，只有约0.7%的值会落在这些围栏之外，因此它们很不可能只是偶然出现。更严格的规则使用3.0倍数，只将最极端的点标记为远端离群值。

Question 4

衡量离散程度时，IQR比标准差更好吗？

Accepted Answer

两种度量适用于不同情况。标准差使用所有数据值，对于没有离群值、对称且正态分布的数据最优。IQR只使用中间50%的数值，因此对偏斜和离群值更有抵抗力。如果数据近似正态，标准差能提供更多信息。如果数据偏斜（收入、房价、生存时间）或包含离群值，IQR更适合衡量典型分散程度。

Question 5

只有两个或三个值的数据集可以使用IQR吗？

Accepted Answer

技术上可以，但结果用途有限。样本很小时（n < 4或5），四分位数估计非常不稳定，IQR不能可靠代表总体离散程度。1.5×IQR离群值规则在极小样本下表现也很差：即使数据有错误也可能不标记离群值，或生成排除合理值的围栏。通常至少需要5–10个观测值，IQR分析才有意义。

数据集	IQR	说明
2, 4, 4, 5, 6, 7, 8, 9	IQR = 3.25（Q1=4，Q3=7.25）	数值个数为偶数。Q1=4，中位数=5.5，Q3=7.25。未检测到离群值。
10, 20, 30, 40, 50, 60, 70	IQR = 30（Q1=25，Q3=55）	奇数个数据：Q1=25，中位数=40，Q3=55，IQR=30。下围栏=−20，上围栏=100。无离群值。
6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49, 78, 108	IQR = 11（Q1=36，Q3=47）	下围栏=19.5，上围栏=63.5。值6、7、15、78和108被标记为离群值。
88, 92, 80, 78, 95, 84, 76, 90, 81, 85, 93	IQR = 10.5（Q1=80.5，Q3=91）	考试成绩范围从76到95。无离群值，说明班级表现较为集中。

IQR计算器 - 四分位距、Q1、Q3与离群值

关于IQR计算器

IQR示例

如何使用IQR计算器

IQR常见问题