IQR-калькулятор - межквартильный размах, Q1, Q3 и выбросы

Рассчитайте межквартильный размах (IQR), квартили Q1 и Q3, медиану и определите выбросы по правилу 1.5×IQR для любого набора данных, разделенного запятыми.

Введите данные как числа, разделенные запятыми, затем нажмите Рассчитать, чтобы получить полную пятичисловую сводку, IQR, значения границ и все выбросы.

IQR-калькулятор - межквартильный размах, Q1, Q3 и выбросы
Рассчитайте межквартильный размах (IQR), квартили Q1 и Q3, медиану и определите выбросы по правилу 1.5×IQR для любого набора данных, разделенного запятыми.

Введите числа, разделяя их запятыми или пробелами, например 2, 4, 4, 5, 6, 7, 8, 9

Об IQR-калькуляторе

Межквартильный размах (IQR) — это диапазон средних 50% набора данных, то есть расстояние между 25-м процентилем (Q1) и 75-м процентилем (Q3). Это одна из самых устойчивых и широко используемых мер статистического разброса, потому что, в отличие от общего размаха или стандартного отклонения, она полностью не зависит от экстремальных значений и выбросов. Анализируете ли вы экзаменационные баллы, показатели артериального давления, цены на жилье, производственные допуски или любой другой реальный набор данных, IQR дает надежное представление о центральном разбросе. Чтобы вычислить IQR, калькулятор сначала сортирует данные от меньшего к большему, а затем находит Q1 и Q3 с помощью линейной интерполяции по порядковым статистикам. Q1 — это значение на 25-м процентиле, точка, ниже которой находится 25% данных. Q3 — это значение на 75-м процентиле, точка, ниже которой находится 75% данных. IQR равен просто Q3 − Q1. Также выводятся медиана (Q2), минимум и максимум, чтобы дать полную пятичисловую сводку, лежащую в основе диаграммы «ящик с усами». Правило 1.5×IQR, введенное Джоном Тьюки, является стандартным методом выявления потенциальных выбросов. Любая точка данных ниже нижней границы (Q1 − 1.5×IQR) или выше верхней границы (Q3 + 1.5×IQR) считается подозрительным выбросом. Эти границы задают «усы» на диаграмме Тьюки. Точка, удаленная более чем на 3×IQR от ближайшего квартиля (внутренняя граница, расширенная до внешней), считается экстремальным выбросом. Калькулятор отмечает все значения за пределами границ 1.5×IQR. Важно понимать, что правило 1.5×IQR выявляет статистические выбросы — значения, необычно далекие от центральной массы данных, — но не обязательно ошибки в данных. Точка, отмеченная как выброс, может быть ошибкой измерения, ошибкой ввода, сигналом мошенничества или просто действительно редким, но корректным наблюдением. Для решения о том, что делать с отмеченными точками, всегда нужны знания предметной области. IQR является предпочтительной мерой разброса, когда данные скошены или ожидаются выбросы, например в распределениях доходов, временах реакции или ценах на жилье на смешанных рынках. Для симметричных, нормально распределенных данных без выбросов стандартное отклонение немного эффективнее. Но когда важна устойчивость — в разведочном анализе данных, непараметрической статистике или всякий раз, когда нельзя предполагать нормальность, — IQR является основным инструментом для описания того, насколько разбросана средняя часть данных.

Примеры IQR

Четыре набора данных показывают, как IQR и обнаружение выбросов работают на практике.

Набор данныхIQRПримечания
2, 4, 4, 5, 6, 7, 8, 9IQR = 3.25 (Q1=4, Q3=7.25)Четное число значений. Q1=4, медиана=5.5, Q3=7.25. Выбросы не обнаружены.
10, 20, 30, 40, 50, 60, 70IQR = 30 (Q1=25, Q3=55)Нечетное количество: Q1=25, медиана=40, Q3=55, IQR=30. Нижняя граница=−20, верхняя граница=100. Выбросов нет.
6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49, 78, 108IQR = 11 (Q1=36, Q3=47)Нижняя граница=19.5, верхняя граница=63.5. Значения 6, 7, 15, 78 и 108 отмечены как выбросы.
88, 92, 80, 78, 95, 84, 76, 90, 81, 85, 93IQR = 10.5 (Q1=80.5, Q3=91)Результаты теста от 76 до 95. Выбросов нет — успеваемость класса плотно сгруппирована.

Как пользоваться IQR-калькулятором

  1. Введите набор данных в поле ввода как числа, разделенные запятыми. Также можно использовать пробелы как разделители. Порядок значений не важен — калькулятор отсортирует их автоматически.
  2. Нажмите Рассчитать IQR. Инструмент покажет n (количество), минимум, максимум, Q1, медиану, Q3, IQR, нижнюю и верхнюю границы, а также все выбросы.
  3. Оцените IQR, чтобы понять, насколько разбросаны средние 50% ваших данных. Более высокий IQR означает большую изменчивость центральной части данных.
  4. Проверьте значения границ. Любая точка ниже Q1 − 1.5×IQR или выше Q3 + 1.5×IQR указывается как потенциальный выброс. Изучите каждую отмеченную точку, чтобы определить, является ли она ошибкой данных или настоящим экстремальным значением.
  5. Используйте кнопки примеров, чтобы загрузить готовые наборы данных и увидеть, как IQR и обнаружение выбросов ведут себя при разных распределениях данных.

Частые вопросы об IQR

Что такое межквартильный размах (IQR)?
Межквартильный размах — это разница между третьим квартилем (Q3, 75-й процентиль) и первым квартилем (Q1, 25-й процентиль): IQR = Q3 − Q1. Он показывает разброс средних 50% данных. Поскольку он игнорирует верхние и нижние 25% значений, IQR не зависит от экстремальных выбросов, что делает его более устойчивой мерой разброса, чем общий размах или стандартное отклонение, когда данные скошены или содержат аномалии.
Как рассчитываются Q1 и Q3?
Калькулятор использует линейную интерполяцию по отсортированным данным. Для Q1 позиция равна 0.25 × (n−1) в отсортированном массиве с нулевой индексацией. Если эта позиция не является целым числом, значение интерполируется между двумя соседними точками данных. Тот же метод используется для Q3 в позиции 0.75 × (n−1). Это тот же метод, который применяют статистические программы, такие как R (type 7), и функция Excel QUARTILE.INC.
Как правило 1.5×IQR выявляет выбросы?
Правило 1.5×IQR Джона Тьюки задает нижнюю границу = Q1 − 1.5×IQR и верхнюю границу = Q3 + 1.5×IQR. Любая точка данных за пределами этих границ является потенциальным выбросом. Множитель 1.5 выбран потому, что при идеально нормальном распределении только около 0.7% значений выходят за эти границы, поэтому их случайное появление крайне маловероятно. Более строгое правило использует множитель 3.0 и отмечает только самые экстремальные точки как дальние выбросы.
IQR лучше стандартного отклонения для измерения разброса?
Каждая мера подходит для разных ситуаций. Стандартное отклонение использует все значения данных и оптимально для симметричных, нормально распределенных данных без выбросов. IQR использует только средние 50% значений и гораздо устойчивее к скошенности и выбросам. Если ваши данные примерно нормальны, стандартное отклонение дает больше информации. Если данные скошены (доходы, цены на жилье, времена выживания) или содержат выбросы, IQR лучше измеряет типичный разброс.
Можно ли использовать IQR для набора данных всего из двух или трех значений?
Технически да, но результат имеет ограниченную полезность. При очень малых выборках (n < 4 или 5) оценки квартилей крайне нестабильны, и IQR не представляет надежно разброс генеральной совокупности. Правило выбросов 1.5×IQR также плохо работает с крошечными выборками: оно может не отметить выбросы, даже если в данных есть ошибки, или создать границы, исключающие корректные значения. Осмысленный анализ IQR обычно требует как минимум 5–10 наблюдений.