IQR 계산기 - 사분위 범위, Q1, Q3, 이상값

쉼표로 구분된 모든 데이터셋에서 사분위 범위(IQR), 사분위수 Q1과 Q3, 중앙값을 계산하고 1.5×IQR 규칙으로 이상값을 식별합니다.

데이터를 쉼표로 구분한 숫자로 입력한 뒤 계산을 클릭하면 전체 다섯 수 요약, IQR, 울타리 값, 이상값을 확인할 수 있습니다.

IQR 계산기 - 사분위 범위, Q1, Q3, 이상값
쉼표로 구분된 모든 데이터셋에서 사분위 범위(IQR), 사분위수 Q1과 Q3, 중앙값을 계산하고 1.5×IQR 규칙으로 이상값을 식별합니다.

숫자를 쉼표나 공백으로 구분해 입력하세요. 예: 2, 4, 4, 5, 6, 7, 8, 9

IQR 계산기 소개

사분위 범위(IQR)는 데이터셋 가운데 50%의 범위, 즉 25번째 백분위수(Q1)와 75번째 백분위수(Q3) 사이의 거리입니다. 전체 범위나 표준편차와 달리 극단값과 이상값의 영향을 전혀 받지 않기 때문에 통계적 산포를 나타내는 가장 견고하고 널리 쓰이는 척도 중 하나입니다. 시험 점수, 혈압 측정값, 주택 가격, 제조 공차 또는 그 밖의 실제 데이터셋을 분석하든 IQR은 중심부의 퍼짐을 신뢰성 있게 보여 줍니다. IQR을 계산할 때 계산기는 먼저 데이터를 작은 값부터 큰 값까지 정렬한 다음, 순서 통계량에 선형 보간을 적용해 Q1과 Q3를 찾습니다. Q1은 25번째 백분위수의 값, 즉 데이터의 25%가 그 아래에 있는 지점입니다. Q3는 75번째 백분위수의 값, 즉 데이터의 75%가 그 아래에 있는 지점입니다. IQR은 단순히 Q3 − Q1입니다. 중앙값(Q2), 최솟값, 최댓값도 함께 보고되어 상자수염그림의 기초가 되는 완전한 다섯 수 요약을 제공합니다. John Tukey가 도입한 1.5×IQR 규칙은 잠재적 이상값을 식별하는 표준 방법입니다. 하한 울타리(Q1 − 1.5×IQR)보다 작거나 상한 울타리(Q3 + 1.5×IQR)보다 큰 데이터 포인트는 의심되는 이상값으로 간주됩니다. 이 울타리들은 Tukey 상자그림의 수염을 정의합니다. 가장 가까운 사분위수에서 3×IQR보다 더 떨어진 점(내부 울타리를 외부 울타리로 확장한 것)은 극단적 이상값으로 간주됩니다. 이 계산기는 1.5×IQR 울타리 밖의 모든 값을 표시합니다. 1.5×IQR 규칙은 통계적 이상값, 즉 데이터의 중심 덩어리에서 비정상적으로 멀리 떨어진 값을 식별하지만, 반드시 데이터 오류를 의미하지는 않는다는 점이 중요합니다. 이상값으로 표시된 점은 측정 오류, 데이터 입력 실수, 사기 신호일 수도 있고, 단순히 정말 드물지만 정당한 관측값일 수도 있습니다. 표시된 점을 어떻게 처리할지는 항상 도메인 지식으로 판단해야 합니다. IQR은 소득 분포, 반응 시간, 혼합 시장의 주택 가격처럼 데이터가 치우쳐 있거나 이상값이 예상될 때 선호되는 산포 척도입니다. 이상값이 없고 대칭적인 정규분포 데이터에서는 표준편차가 약간 더 효율적입니다. 그러나 견고성이 중요한 경우, 예를 들어 탐색적 데이터 분석, 비모수 통계, 또는 정규성을 가정할 수 없는 상황에서는 IQR이 데이터 중간 부분의 퍼짐을 설명하는 대표적인 도구입니다.

IQR 예시

IQR과 이상값 탐지가 실제로 어떻게 작동하는지 보여 주는 네 가지 데이터셋입니다.

데이터셋IQR메모
2, 4, 4, 5, 6, 7, 8, 9IQR = 3.25(Q1=4, Q3=7.25)값의 개수가 짝수입니다. Q1=4, 중앙값=5.5, Q3=7.25. 이상값은 감지되지 않았습니다.
10, 20, 30, 40, 50, 60, 70IQR = 30(Q1=25, Q3=55)홀수 개수: Q1=25, 중앙값=40, Q3=55, IQR=30. 하한 울타리=−20, 상한 울타리=100. 이상값 없음.
6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49, 78, 108IQR = 11(Q1=36, Q3=47)하한 울타리=19.5, 상한 울타리=63.5. 값 6, 7, 15, 78, 108이 이상값으로 표시됩니다.
88, 92, 80, 78, 95, 84, 76, 90, 81, 85, 93IQR = 10.5(Q1=80.5, Q3=91)시험 점수는 76부터 95까지입니다. 이상값은 없으며, 반 전체 성적이 촘촘히 모여 있습니다.

IQR 계산기 사용 방법

  1. 입력 필드에 데이터셋을 쉼표로 구분한 숫자로 입력합니다. 공백도 구분자로 사용할 수 있습니다. 값의 순서는 중요하지 않으며 계산기가 자동으로 정렬합니다.
  2. IQR 계산을 클릭합니다. 도구는 n(개수), 최솟값, 최댓값, Q1, 중앙값, Q3, IQR, 하한 및 상한 울타리, 이상값을 표시합니다.
  3. IQR을 확인해 데이터 가운데 50%가 얼마나 퍼져 있는지 이해합니다. IQR이 클수록 데이터 중심부의 변동성이 더 큽니다.
  4. 울타리 값을 확인합니다. Q1 − 1.5×IQR보다 작거나 Q3 + 1.5×IQR보다 큰 데이터 포인트는 잠재적 이상값으로 나열됩니다. 표시된 각 점이 데이터 오류인지 실제 극단값인지 조사하세요.
  5. 예시 버튼으로 미리 준비된 데이터셋을 불러와 다양한 데이터 분포에서 IQR과 이상값 탐지가 어떻게 동작하는지 확인합니다.

IQR FAQ

사분위 범위(IQR)란 무엇인가요?
사분위 범위는 제3사분위수(Q3, 75번째 백분위수)와 제1사분위수(Q1, 25번째 백분위수)의 차이입니다: IQR = Q3 − Q1. 이는 데이터 가운데 50%의 퍼짐을 나타냅니다. 상위와 하위 25%의 값을 무시하므로 IQR은 극단적 이상값의 영향을 받지 않아, 데이터가 치우쳐 있거나 이상값을 포함할 때 전체 범위나 표준편차보다 더 견고한 산포 척도입니다.
Q1과 Q3는 어떻게 계산하나요?
계산기는 정렬된 데이터에 선형 보간을 사용합니다. Q1의 위치는 0부터 시작하는 정렬 배열에서 0.25 × (n−1)입니다. 그 위치가 정수가 아니면 인접한 두 데이터 포인트 사이를 보간합니다. Q3도 같은 방법을 사용하며 위치는 0.75 × (n−1)입니다. 이는 R(type 7)과 Excel의 QUARTILE.INC 함수에서 사용하는 방법과 같습니다.
1.5×IQR 규칙은 이상값을 어떻게 식별하나요?
John Tukey의 1.5×IQR 규칙은 하한 울타리 = Q1 − 1.5×IQR, 상한 울타리 = Q3 + 1.5×IQR로 정의합니다. 이 울타리 밖에 있는 모든 데이터 포인트는 잠재적 이상값입니다. 1.5라는 배수는 완전한 정규분포에서 약 0.7%의 값만 이 울타리 밖에 놓이므로 우연히 발생할 가능성이 매우 낮기 때문에 선택되었습니다. 더 엄격한 규칙은 3.0 배수를 사용해 가장 극단적인 점만 먼 이상값으로 표시합니다.
퍼짐을 측정할 때 IQR이 표준편차보다 더 좋은가요?
각 척도는 서로 다른 상황에 적합합니다. 표준편차는 모든 데이터 값을 사용하며 이상값이 없고 대칭적인 정규분포 데이터에 최적입니다. IQR은 가운데 50%의 값만 사용하므로 치우침과 이상값에 훨씬 강합니다. 데이터가 거의 정규분포라면 표준편차가 더 많은 정보를 제공합니다. 데이터가 치우쳐 있거나(소득, 주택 가격, 생존 시간) 이상값을 포함한다면 IQR이 전형적인 퍼짐을 측정하는 더 나은 척도입니다.
값이 두세 개뿐인 데이터셋에도 IQR을 사용할 수 있나요?
기술적으로는 가능하지만 결과의 유용성은 제한적입니다. 매우 작은 표본(n < 4 또는 5)에서는 사분위수 추정이 매우 불안정하고 IQR이 모집단의 퍼짐을 신뢰성 있게 나타내지 못합니다. 1.5×IQR 이상값 규칙도 작은 표본에서는 잘 작동하지 않아, 데이터에 오류가 있어도 이상값을 표시하지 않거나 정당한 값을 제외하는 울타리를 만들 수 있습니다. 의미 있는 IQR 분석에는 일반적으로 최소 5–10개의 관측값이 필요합니다.