topic★★★★★난이도 · 약 12분
인터페이스 오류 처리와 재처리
인터페이스 통신 실패 시 감지·기록·통지·재처리의 4단계 표준 절차.
#오류처리#재처리#모니터링
왜 배우는가
인터페이스 장애 대응 절차를 약술하는 문제가 출제된다. 특히 로깅, 알림, 재시도(재처리) 의 개념 구분이 포인트.
인터페이스 통신은 네트워크 단절·서버 장애·데이터 오류 등 다양한 이유로 실패할 수 있다. 모든 실패는 '감지 → 기록 → 통지 → 재처리'의 4단계로 대응한다.
| 단계 | 설명 | 도구/기법 |
|---|---|---|
| 1. 감지 | 통신 실패·응답 지연·데이터 불일치 발견 | Health Check, 타임아웃, 응답 코드 |
| 2. 기록 | 오류 시각·요청/응답 내용·오류 코드 로깅 | 로그 파일, DB, APM |
| 3. 통지 | 담당자에게 알림 전송 | 이메일, SMS, Slack, PagerDuty |
| 4. 재처리 | 자동 재시도 또는 수동 개입 | 지수 백오프, DLQ(Dead Letter Queue) |
지수 백오프(Exponential Backoff) — 재시도 간격을 1초 → 2초 → 4초 → 8초처럼 점점 늘려가는 전략. 서버 부하를 줄이면서 일시적 장애를 극복한다.
DLQ (Dead Letter Queue) — 일정 횟수 재시도 후에도 실패한 메시지를 보관하는 별도 큐. 운영자가 원인을 분석하고 수동으로 재처리할 수 있다. MOM(Message Oriented Middleware)의 대표 패턴.
오류 로그에는 반드시 추적 ID(Trace ID) 를 포함시켜야 송·수신 시스템 양쪽 로그를 매칭할 수 있다. 추적 ID 없는 로그는 장애 원인 분석이 매우 어려워진다.
실기 드릴 3문항
edit실기 드릴 · 단답형
인터페이스 오류 처리의 4단계 절차를 순서대로 쓰시오.
edit실기 드릴 · 단답형
재시도 간격을 1초 → 2초 → 4초 → 8초처럼 점점 늘려가는 재처리 전략의 이름은?
space_bar실기 드릴 · 빈칸 채우기
일정 횟수 재시도 후에도 실패한 메시지를 보관하여 운영자가 원인을 분석·재처리할 수 있게 하는 별도 큐를 ( ) 라고 한다.