정규분포와 통계
종 모양 곡선, 표준편차, 68-95-99.7 법칙.
사람들의 키, 시험 점수, 제품의 품질 — 자연과 사회의 많은 현상이 종 모양(정규분포)을 따른다. 이 패턴을 알면 '내 점수가 상위 몇 %인지', '불량품이 얼마나 나올지' 예측할 수 있다.
정규분포(Normal Distribution)는 평균을 중심으로 좌우 대칭인 종 모양 곡선이다. 평균 근처에 데이터가 가장 많이 모이고, 평균에서 멀어질수록 급격히 줄어든다. 가우스가 연구했으므로 가우스 분포라고도 한다.
68-95-99.7 법칙: 평균 ± 1σ(표준편차) 안에 68%, ± 2σ 안에 95%, ± 3σ 안에 99.7%의 데이터가 들어간다. 3σ 밖의 확률은 0.3% — '거의 일어나지 않는 일'이다.
| 용어 | 의미 | 공식 |
|---|---|---|
| 평균(μ) | 데이터의 중심 | 전체 합 / 개수 |
| 분산(σ²) | 흩어진 정도의 제곱 | Σ(xᵢ - μ)² / n |
| 표준편차(σ) | 흩어진 정도 | √분산 |
| 표준화(Z) | 표준정규분포로 변환 | Z = (x - μ) / σ |
표준화(Z-score): 시험 평균 70, 표준편차 10일 때 90점의 Z값은 (90-70)/10 = 2. 이는 평균에서 표준편차 2배만큼 위에 있다는 뜻으로, 상위 약 2.3%에 해당한다.
실생활 응용 — ① 수능 표준점수·상위 % 환산 ② 제조업 6시그마 품질관리(3.4 DPMO) ③ 의학 검사 정상 범위(평균 ± 2σ) ④ 금융 VaR·리스크 측정 ⑤ AI 모델 가중치 초기화(가우시안 분포).
정규분포에서 평균 ± 1σ 안에는 전체 데이터의 약 ____%가 들어간다.
정규분포의 표준편차가 커질수록 곡선은 더 뾰족하고 좁아진다.
수능 시험 평균 60, 표준편차 15인 정규분포에서 75점을 받은 학생의 Z-score를 구하시오.
평균 100, 표준편차 10인 정규분포에서 130을 넘는 값이 나올 확률은 약 0.15%다.