Question 1

도수분포표란 무엇인가요?

Accepted Answer

도수분포표는 원시 수치 데이터를 계급구간(bin)이라는 그룹으로 나누고 각 그룹에 몇 개의 값이 들어가는지 세는 표입니다. 무질서한 목록을 구조화된 요약으로 바꿔 데이터가 어디에 몰려 있는지, 얼마나 퍼져 있는지, 전체 모양이 어떤지 보여줍니다.

Question 2

계급 수는 어떻게 정하나요?

Accepted Answer

일반적인 방법은 Sturges 공식입니다. k = 1 + 3.322 × log₁₀(n)이며 n은 표본 크기입니다. 이렇게 하면 20개 데이터는 약 5개 계급, 100개 데이터는 약 7개 계급이 됩니다. 또는 5개 계급으로 시작해, 분포가 너무 시끄러워지지 않으면서도 명확한 패턴이 보일 때까지 늘려 보세요. 대부분의 교재는 5~15개 계급을 권장합니다.

Question 3

상대도수란 무엇이고 왜 유용한가요?

Accepted Answer

상대도수는 한 계급에 들어가는 관측치의 비율입니다. 상대도수 = 해당 계급의 도수 / 전체 n. 개수를 백분율로 바꿔 주기 때문에 크기가 다른 데이터셋을 비교하기 쉽습니다. 예를 들어 시험 점수의 35%가 70~80 구간에 있다면, 서로 다른 규모의 두 반을 비교할 때 단순한 개수보다 훨씬 유용합니다.

Question 4

누적도수란 무엇인가요?

Accepted Answer

누적도수는 첫 번째 계급부터 현재 계급까지의 도수를 계속 더한 값입니다. 각 계급의 상한 이하에 몇 개의 데이터 포인트가 있는지 알려 줍니다. 예를 들어 세 번째 계급이 끝날 때 누적도수가 15/20이면 관측치의 75%가 처음 세 개 계급에 들어 있습니다. 누적도수는 ogive(누적도수 곡선)의 기반입니다.

Question 5

평균과 표준편차에 왜 'grouped'가 붙나요?

Accepted Answer

데이터를 계급구간으로 묶으면 정확한 개별 값이 사라집니다. 그룹화된 평균과 표준편차는 각 계급의 계급값을 대표값으로 사용해 계산하므로 작은 근사가 생깁니다. 계급폭이 범위에 비해 충분히 작으면 매우 정확하지만, 원시 데이터로 계산한 통계와는 약간 다를 수 있습니다.

Question 6

도수 히스토그램과 상대도수 히스토그램의 차이는 무엇인가요?

Accepted Answer

도수 히스토그램은 y축에 원시 개수를 표시하고, 상대도수 히스토그램은 비율(또는 백분율)을 표시합니다. 상대도수 히스토그램은 크기가 다른 데이터셋을 직접 비교할 수 있고, 바탕이 되는 확률분포의 경험적 근사로도 사용할 수 있습니다. 모양은 같고 y축 스케일만 달라집니다.

데이터셋	구조	맥락
82,90,75,68,88,75,95,100,72,85,91,78,84,88,77,95,65,80,73,86 — 5개 계급	계급: [65,72), [72,79), [79,86) … ; 평균 ≈ 82.85	20명의 학생으로 이루어진 학급의 시험 점수입니다. 계급폭 = 7. 대부분의 점수는 72–93 구간에 모여 있으며 약간의 왼쪽 꼬리가 있습니다.
150,220,180,190,250,160,200,210,170,240,195,175,215,185,230 — 6개 계급	계급: [150,170), [170,190), [190,210) … ; 평균 ≈ 202.7	일일 매출 수치입니다. 계급폭 = 20. 분포는 대부분의 날이 170–230달러 구간에 몰려 있음을 보여줍니다.
35,42,38,50,45,48,36,39,47,41,43,46,40,37,44,49,38,42,45,36 — 5개 계급	계급: [35,38), [38,41), [41,44) … ; 평균 ≈ 42.1	식물학 연구에서 측정한 식물 높이(cm)입니다. 종 모양 분포는 대체로 정규적인 성장 패턴을 확인해 줍니다.

도수분포 계산기 - 표 만들기

도수분포 계산기 소개

도수분포 — 예시

도수분포 계산기 사용 방법

도수분포 계산기 — FAQ