도수분포 계산기 - 표 만들기
어떤 데이터셋이든 완전한 도수분포표를 빠르게 생성하세요. 계급구간, 도수, 상대도수, 누적도수, 핵심 요약 통계를 즉시 확인할 수 있습니다.
숫자를 쉼표, 공백 또는 줄바꿈으로 구분해 붙여넣거나 입력한 뒤, 계급 수를 선택하고 계산을 클릭하면 전체 도수표와 요약이 생성됩니다.
도수분포 계산기
데이터를 계급구간으로 묶고 도수와 통계를 계산
숫자는 쉼표, 공백, 줄바꿈으로 구분할 수 있습니다.
도수분포 계산기 소개
도수분포는 각 값 또는 값의 범위가 데이터셋에 얼마나 자주 나타나는지를 보여주는 표 형식 요약입니다. 원시 데이터를 관리하기 쉬운 수의 계급구간으로 나누고 각 구간의 관측치를 세면, 무질서한 숫자 목록이 데이터의 형태, 중심, 퍼짐을 보여주는 구조화된 그림으로 바뀝니다. 도수분포는 기술통계의 기초 개념이며 히스토그램, 상대도수 다각형, 누적도수 곡선의 기반이 됩니다.
그룹화된 도수분포는 데이터 범위를 서로 겹치지 않는 같은 폭의 계급구간으로 나눕니다. 각 구간에는 하한, 상한, 계급값이 있습니다. 도수는 해당 구간에 속하는 데이터 포인트의 개수입니다. 상대도수는 도수를 전체 개수에 대한 비율(또는 백분율)로 나타낸 것으로, 서로 다른 크기의 데이터셋을 비교하기 쉽게 해줍니다. 누적도수는 첫 번째 계급부터 현재 계급까지의 도수를 계속 더한 값으로, 각 계급 경계 이하에 몇 개의 데이터 포인트가 있는지 보여줍니다.
계급 수 선택은 균형이 중요합니다. 너무 적으면 서로 다른 패턴이 하나로 뭉개지고, 너무 많으면 데이터가 지나치게 잘게 쪼개져 명확한 패턴이 보이지 않습니다. 일반적인 경험칙은 Sturges 공식입니다. k = 1 + 3.322 × log₁₀(n)이며, n은 데이터 포인트 수입니다. 예를 들어 20개 데이터는 약 5개 계급, 100개 데이터는 약 7개 계급이 적절합니다. 계급폭은 width = (max − min) / k로 계산한 뒤, 모든 데이터가 깔끔하게 들어가도록 편리한 값으로 올림합니다.
도수분포에서 도출한 요약 통계는 개별 값이 아니라 그룹화된 데이터를 바탕으로 한 근사치입니다. 그룹화된 평균은 Σ(계급값 × 도수) / n으로 계산합니다. 그룹화된 표준편차는 그룹화된 평균 주변의 퍼짐을 측정합니다. 그룹화된 중앙값은 n/2번째 관측치를 포함하는 계급구간 안에서 보간해 추정합니다. 계급폭이 범위에 비해 작을수록 이러한 근사치는 원시 데이터로 계산한 정확한 값과 매우 가깝습니다.
도수분포는 수치 데이터를 만드는 모든 분야에서 사용됩니다. 교육에서는 시험 점수를 분석해 추가 지원이 필요한 학생을 찾습니다. 기업은 매출 거래액, 제품 평점, 고객 대기 시간 등을 분석해 피크와 병목을 파악합니다. 의료 연구에서는 혈압, 콜레스테롤, BMI 같은 임상 지표를 분포시켜 인구 건강을 이해합니다. 품질관리 엔지니어는 생산 공정의 측정값을 검토해 결함이나 편차를 찾아냅니다. 모든 경우에 도수분포표는 더 고급 분석의 출발점입니다.
도수분포 — 예시
서로 다른 계급 구조와 요약 통계를 보여주는 세 가지 실용 데이터셋입니다.
| 데이터셋 | 구조 | 맥락 |
|---|---|---|
| 82,90,75,68,88,75,95,100,72,85,91,78,84,88,77,95,65,80,73,86 — 5개 계급 | 계급: [65,72), [72,79), [79,86) … ; 평균 ≈ 82.85 | 20명의 학생으로 이루어진 학급의 시험 점수입니다. 계급폭 = 7. 대부분의 점수는 72–93 구간에 모여 있으며 약간의 왼쪽 꼬리가 있습니다. |
| 150,220,180,190,250,160,200,210,170,240,195,175,215,185,230 — 6개 계급 | 계급: [150,170), [170,190), [190,210) … ; 평균 ≈ 202.7 | 일일 매출 수치입니다. 계급폭 = 20. 분포는 대부분의 날이 170–230달러 구간에 몰려 있음을 보여줍니다. |
| 35,42,38,50,45,48,36,39,47,41,43,46,40,37,44,49,38,42,45,36 — 5개 계급 | 계급: [35,38), [38,41), [41,44) … ; 평균 ≈ 42.1 | 식물학 연구에서 측정한 식물 높이(cm)입니다. 종 모양 분포는 대체로 정규적인 성장 패턴을 확인해 줍니다. |
도수분포 계산기 사용 방법
- ‘데이터셋’ 필드에 수치 데이터를 입력하세요. 쉼표, 공백, 줄바꿈으로 구분할 수 있으며 이 구분자들을 섞어 사용해도 됩니다.
- 데이터셋에 맞는 계급 수를 선택하세요. 작은 데이터셋(n < 30)은 5개 계급, 더 큰 데이터셋은 7~10개 계급이 좋은 시작점입니다. Sturges 공식 k ≈ 1 + 3.322 × log₁₀(n)도 사용할 수 있습니다.
- ‘계산’을 클릭하세요. 계산기는 최소값과 최대값을 찾고, 계급폭을 (max − min) / classes로 계산한 뒤 올림하며, 각 데이터 포인트를 적절한 구간에 할당합니다.
- 도수표를 읽어보세요. 각 행에는 계급구간, 계급값, 도수, 상대도수(전체 대비 백분율), 누적도수(누적 합계)가 표시됩니다.
- 표 아래의 요약 통계에서 그룹화된 평균, 중앙값, 표준편차, 계급폭을 확인하세요. 미리 채워진 데이터셋을 시험해 보려면 예시 불러오기 버튼을 사용할 수 있습니다.
도수분포 계산기 — FAQ
도수분포표란 무엇인가요?
도수분포표는 원시 수치 데이터를 계급구간(bin)이라는 그룹으로 나누고 각 그룹에 몇 개의 값이 들어가는지 세는 표입니다. 무질서한 목록을 구조화된 요약으로 바꿔 데이터가 어디에 몰려 있는지, 얼마나 퍼져 있는지, 전체 모양이 어떤지 보여줍니다.
계급 수는 어떻게 정하나요?
일반적인 방법은 Sturges 공식입니다. k = 1 + 3.322 × log₁₀(n)이며 n은 표본 크기입니다. 이렇게 하면 20개 데이터는 약 5개 계급, 100개 데이터는 약 7개 계급이 됩니다. 또는 5개 계급으로 시작해, 분포가 너무 시끄러워지지 않으면서도 명확한 패턴이 보일 때까지 늘려 보세요. 대부분의 교재는 5~15개 계급을 권장합니다.
상대도수란 무엇이고 왜 유용한가요?
상대도수는 한 계급에 들어가는 관측치의 비율입니다. 상대도수 = 해당 계급의 도수 / 전체 n. 개수를 백분율로 바꿔 주기 때문에 크기가 다른 데이터셋을 비교하기 쉽습니다. 예를 들어 시험 점수의 35%가 70~80 구간에 있다면, 서로 다른 규모의 두 반을 비교할 때 단순한 개수보다 훨씬 유용합니다.
누적도수란 무엇인가요?
누적도수는 첫 번째 계급부터 현재 계급까지의 도수를 계속 더한 값입니다. 각 계급의 상한 이하에 몇 개의 데이터 포인트가 있는지 알려 줍니다. 예를 들어 세 번째 계급이 끝날 때 누적도수가 15/20이면 관측치의 75%가 처음 세 개 계급에 들어 있습니다. 누적도수는 ogive(누적도수 곡선)의 기반입니다.
평균과 표준편차에 왜 'grouped'가 붙나요?
데이터를 계급구간으로 묶으면 정확한 개별 값이 사라집니다. 그룹화된 평균과 표준편차는 각 계급의 계급값을 대표값으로 사용해 계산하므로 작은 근사가 생깁니다. 계급폭이 범위에 비해 충분히 작으면 매우 정확하지만, 원시 데이터로 계산한 통계와는 약간 다를 수 있습니다.
도수 히스토그램과 상대도수 히스토그램의 차이는 무엇인가요?
도수 히스토그램은 y축에 원시 개수를 표시하고, 상대도수 히스토그램은 비율(또는 백분율)을 표시합니다. 상대도수 히스토그램은 크기가 다른 데이터셋을 직접 비교할 수 있고, 바탕이 되는 확률분포의 경험적 근사로도 사용할 수 있습니다. 모양은 같고 y축 스케일만 달라집니다.