통계

자료의 정리 — 도수분포표부터 히스토그램까지

줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형으로 자료를 정리하고 해석합니다. 상대도수를 이용해 서로 다른 집단을 비교하는 방법도 배웁니다.

우리 반 수학 점수 30개를 그냥 나열하면 이해하기 어렵습니다. 하지만 도수분포표로 정리하고 히스토그램을 그리면 데이터의 분포가 한눈에 보입니다. 이것이 통계의 힘입니다.

1. 줄기와 잎 그림

자료를 줄기(십의 자리)잎(일의 자리)으로 나눠 표현합니다.

수학 점수: 72, 85, 91, 68, 75, 83, 94, 77, 88, 62

줄기 | 잎
  6  | 2, 8
  7  | 2, 5, 7
  8  | 3, 5, 8
  9  | 1, 4

장점: 원래 자료 값을 그대로 확인 가능, 중앙값 찾기 쉬움

2. 도수분포표

자료를 계급(구간)으로 나누어 각 계급에 속하는 자료의 수(도수)를 정리한 표입니다.

용어 정리

  • 계급: 자료를 나누는 구간 (예: 60이상 70미만)
  • 계급의 크기: 구간의 너비 (예: 10)
  • 계급값: 구간의 중앙값 (예: 65)
  • 도수: 해당 구간에 속하는 자료의 수
점수 (계급)계급값도수상대도수
60이상 70미만6540.13
70이상 80미만75100.33
80이상 90미만85120.40
90이상 100이하9540.13
합계301.00

3. 히스토그램

도수분포표를 막대그래프로 나타낸 것으로, 막대의 너비가 계급의 크기, 높이가 도수입니다.

  • 막대 사이에 간격이 없음 (연속적인 데이터 표현)
  • 가로축: 계급, 세로축: 도수 (또는 상대도수)

4. 도수분포다각형

히스토그램의 각 막대 윗면의 중점을 연결한 꺾은선그래프입니다.

  • 양 끝에 도수가 0인 계급을 추가하여 그래프가 가로축과 닫힘
  • 두 집단을 겹쳐서 비교하기 편리

5. 상대도수(相對度數)

  • 상대도수의 합 = 1
  • 전체 크기가 다른 두 집단을 공정하게 비교할 때 사용
A반(40명)과 B반(30명)의 80점 이상 비율 비교:
A반: 도수 12명 → 상대도수 = 12/40 = 0.30 (30%)
B반: 도수 10명 → 상대도수 = 10/30 = 0.33 (33%)
→ 도수는 A반이 많지만 비율은 B반이 높음

6. 자료 분석 — 최빈값과 중앙값 위치 추정

도수분포표에서:
- 도수가 가장 큰 계급의 계급값 → 최빈값 근사
- 도수의 누적합이 전체의 1/2이 되는 계급 → 중앙값 계급
  (전체 30명이면 15~16번째 자료가 있는 계급)

핵심 정리

  • 줄기와 잎: 원자료 확인 가능
  • 도수분포표: 계급별 도수 정리
  • 히스토그램: 도수를 막대로 표시 (간격 없음)
  • 상대도수 = 도수 ÷ 전체 / 집단 간 비교 시 사용

🎯 이 단원을 마스터했나요?

다음 단계로 넘어가거나, 더 많은 연습 문제를 풀어보세요.