우리 반 수학 점수 30개를 그냥 나열하면 이해하기 어렵습니다. 하지만 도수분포표로 정리하고 히스토그램을 그리면 데이터의 분포가 한눈에 보입니다. 이것이 통계의 힘입니다.
1. 줄기와 잎 그림
자료를 줄기(십의 자리)와 잎(일의 자리)으로 나눠 표현합니다.
수학 점수: 72, 85, 91, 68, 75, 83, 94, 77, 88, 62
줄기 | 잎
6 | 2, 8
7 | 2, 5, 7
8 | 3, 5, 8
9 | 1, 4
장점: 원래 자료 값을 그대로 확인 가능, 중앙값 찾기 쉬움
2. 도수분포표
자료를 계급(구간)으로 나누어 각 계급에 속하는 자료의 수(도수)를 정리한 표입니다.
용어 정리
- 계급: 자료를 나누는 구간 (예: 60이상 70미만)
- 계급의 크기: 구간의 너비 (예: 10)
- 계급값: 구간의 중앙값 (예: 65)
- 도수: 해당 구간에 속하는 자료의 수
| 점수 (계급) | 계급값 | 도수 | 상대도수 |
|---|---|---|---|
| 60이상 70미만 | 65 | 4 | 0.13 |
| 70이상 80미만 | 75 | 10 | 0.33 |
| 80이상 90미만 | 85 | 12 | 0.40 |
| 90이상 100이하 | 95 | 4 | 0.13 |
| 합계 | 30 | 1.00 |
3. 히스토그램
도수분포표를 막대그래프로 나타낸 것으로, 막대의 너비가 계급의 크기, 높이가 도수입니다.
- 막대 사이에 간격이 없음 (연속적인 데이터 표현)
- 가로축: 계급, 세로축: 도수 (또는 상대도수)
4. 도수분포다각형
히스토그램의 각 막대 윗면의 중점을 연결한 꺾은선그래프입니다.
- 양 끝에 도수가 0인 계급을 추가하여 그래프가 가로축과 닫힘
- 두 집단을 겹쳐서 비교하기 편리
5. 상대도수(相對度數)
- 상대도수의 합 = 1
- 전체 크기가 다른 두 집단을 공정하게 비교할 때 사용
A반(40명)과 B반(30명)의 80점 이상 비율 비교:
A반: 도수 12명 → 상대도수 = 12/40 = 0.30 (30%)
B반: 도수 10명 → 상대도수 = 10/30 = 0.33 (33%)
→ 도수는 A반이 많지만 비율은 B반이 높음
6. 자료 분석 — 최빈값과 중앙값 위치 추정
도수분포표에서:
- 도수가 가장 큰 계급의 계급값 → 최빈값 근사
- 도수의 누적합이 전체의 1/2이 되는 계급 → 중앙값 계급
(전체 30명이면 15~16번째 자료가 있는 계급)
핵심 정리
- 줄기와 잎: 원자료 확인 가능
- 도수분포표: 계급별 도수 정리
- 히스토그램: 도수를 막대로 표시 (간격 없음)
- 상대도수 = 도수 ÷ 전체 / 집단 간 비교 시 사용