데이터 품질 6차원
정확성 · 완전성 · 일관성 · 유효성 · 유일성 · 적시성.
2023년 이후 실기 신규 고빈도 주제. 6차원 이름을 쓰라는 단답형 + 각 차원에 해당하는 실무 예시 매칭. 데이터 품질 관리(DQM)와 데이터 거버넌스 연계 문항도 등장.
데이터 품질(Data Quality)은 "데이터가 목적에 적합한가"를 다차원으로 평가한다. ISO/IEC 25012, DAMA-DMBOK 등이 6~8차원을 제시하며, 정보처리기사는 한국 DQC-M 기준 6차원을 표준으로 출제한다.
| 차원 | 영문 | 정의 | 예시 위반 |
|---|---|---|---|
| 정확성 | Accuracy | 실세계 값과 일치 | 실제 성별 M인데 F 저장 |
| 완전성 | Completeness | 필수 값 누락 없음 | NOT NULL인데 NULL |
| 일관성 | Consistency | 관련 값 간 모순 없음 | 주문=100인데 배송=99 |
| 유효성 | Validity | 도메인·형식 규칙 준수 | 전화번호 형식 위반 |
| 유일성 | Uniqueness | 중복 레코드 없음 | PK 중복 |
| 적시성 | Timeliness | 시점이 최신 | 2020년 데이터로 2024년 판단 |
암기법 — 정·완·일·유·유·적. "정완일유유적" 6글자. 유효성과 유일성이 연이어 나와 헷갈리므로 영문 Validity ≠ Uniqueness 병행 암기.
ISO/IEC 25012 는 15차원까지 세분화(Credibility·Accessibility·Portability 등 추가). 정보처리기사 시험은 한국 DQC-M 6차원 기준이지만, 보기에 Credibility 같은 영문이 섞여 나오면 ISO 확장 차원임을 인지하고 제거.
데이터 거버넌스(Data Governance) — 데이터 품질을 조직 차원에서 관리하는 체계. 3요소: (1) 데이터 표준, (2) 데이터 품질, (3) 메타데이터. MDM(Master Data Management)은 그 실행 수단.
한국 DQC-M 기준 데이터 품질 6차원을 모두 쓰시오.
전화번호 컬럼에 `"abc-1234"`가 들어간 경우 위반된 품질 차원은?
PK 컬럼에 같은 값이 두 번 들어간 경우 ( ) 차원의 위반이다.
"2020년 인구 데이터로 2024년 의사결정"은 일관성 차원의 위반이다.