topic난이도 · 약 12

인터페이스 오류 처리와 재처리

인터페이스 통신 실패 시 감지·기록·통지·재처리의 4단계 표준 절차.

#오류처리#재처리#모니터링
왜 배우는가

인터페이스 장애 대응 절차를 약술하는 문제가 출제된다. 특히 로깅, 알림, 재시도(재처리) 의 개념 구분이 포인트.

인터페이스 통신은 네트워크 단절·서버 장애·데이터 오류 등 다양한 이유로 실패할 수 있다. 모든 실패는 '감지 → 기록 → 통지 → 재처리'의 4단계로 대응한다.

단계설명도구/기법
1. 감지통신 실패·응답 지연·데이터 불일치 발견Health Check, 타임아웃, 응답 코드
2. 기록오류 시각·요청/응답 내용·오류 코드 로깅로그 파일, DB, APM
3. 통지담당자에게 알림 전송이메일, SMS, Slack, PagerDuty
4. 재처리자동 재시도 또는 수동 개입지수 백오프, DLQ(Dead Letter Queue)

지수 백오프(Exponential Backoff) — 재시도 간격을 1초 → 2초 → 4초 → 8초처럼 점점 늘려가는 전략. 서버 부하를 줄이면서 일시적 장애를 극복한다.

DLQ (Dead Letter Queue) — 일정 횟수 재시도 후에도 실패한 메시지를 보관하는 별도 큐. 운영자가 원인을 분석하고 수동으로 재처리할 수 있다. MOM(Message Oriented Middleware)의 대표 패턴.

오류 로그에는 반드시 추적 ID(Trace ID) 를 포함시켜야 송·수신 시스템 양쪽 로그를 매칭할 수 있다. 추적 ID 없는 로그는 장애 원인 분석이 매우 어려워진다.

실기 드릴 3문항
edit실기 드릴 · 단답형

인터페이스 오류 처리의 4단계 절차를 순서대로 쓰시오.

edit실기 드릴 · 단답형

재시도 간격을 1초 → 2초 → 4초 → 8초처럼 점점 늘려가는 재처리 전략의 이름은?

space_bar실기 드릴 · 빈칸 채우기

일정 횟수 재시도 후에도 실패한 메시지를 보관하여 운영자가 원인을 분석·재처리할 수 있게 하는 별도 큐를 ( ) 라고 한다.