텔레메트리 라우팅 구조 선택 (중앙 Collector fan-out)
상태
승인
후보군
| 방안 | 설명 |
|---|---|
| 중앙 OTel Collector fan-out | 서비스는 Collector 하나로만 전송, Collector가 SigNoz·Grafana로 분기 |
| 서비스별 dual-export | 각 서비스가 SigNoz·Grafana 두 백엔드로 직접 2중 전송 |
| SigNoz 내장 collector 재사용 | SigNoz가 번들한 collector를 게이트웨이로 사용 |
결정
단일 OpenTelemetry Collector(게이트웨이) 를 두고, 서비스는 Collector로만 전송한다. Collector가 SigNoz와 Grafana(Tempo/Prometheus/Loki)로 fan-out한다.
결정 이유
- 두 스택이 완전히 동일한 입력을 받아야 PoC 비교가 공정하다. fan-out 지점을 한 곳으로 모으면 보장된다.
- 서비스가 백엔드를 모르게 분리 → 스택 추가/제거가 Collector 설정 변경으로 끝남.
- 인프라 exporter 메트릭도 Collector의 prometheus receiver로 함께 수집해 라우팅을 일원화.
검토 대안
| 방안 | 기각 이유 |
|---|---|
| 서비스별 dual-export | 서비스마다 두 엔드포인트 설정 중복, 한쪽만 누락될 위험, 비교 공정성 깨짐 |
| SigNoz 내장 collector 재사용 | SigNoz에 종속된 게이트웨이라 Grafana로의 중립 fan-out에 부적합 |
트레이드 오프
- (득) 공정 비교, 서비스-백엔드 디커플링, 단일 라우팅 관리점.
- (실) Collector가 단일 장애점(SPOF)이 됨 → 서비스는 export 실패 시 graceful degrade로 영향 차단.