텔레메트리 라우팅 구조 선택 (중앙 Collector fan-out)

상태

승인

후보군

방안설명
중앙 OTel Collector fan-out서비스는 Collector 하나로만 전송, Collector가 SigNoz·Grafana로 분기
서비스별 dual-export각 서비스가 SigNoz·Grafana 두 백엔드로 직접 2중 전송
SigNoz 내장 collector 재사용SigNoz가 번들한 collector를 게이트웨이로 사용

결정

단일 OpenTelemetry Collector(게이트웨이) 를 두고, 서비스는 Collector로만 전송한다. Collector가 SigNoz와 Grafana(Tempo/Prometheus/Loki)로 fan-out한다.

결정 이유

  • 두 스택이 완전히 동일한 입력을 받아야 PoC 비교가 공정하다. fan-out 지점을 한 곳으로 모으면 보장된다.
  • 서비스가 백엔드를 모르게 분리 → 스택 추가/제거가 Collector 설정 변경으로 끝남.
  • 인프라 exporter 메트릭도 Collector의 prometheus receiver로 함께 수집해 라우팅을 일원화.

검토 대안

방안기각 이유
서비스별 dual-export서비스마다 두 엔드포인트 설정 중복, 한쪽만 누락될 위험, 비교 공정성 깨짐
SigNoz 내장 collector 재사용SigNoz에 종속된 게이트웨이라 Grafana로의 중립 fan-out에 부적합

트레이드 오프

  • (득) 공정 비교, 서비스-백엔드 디커플링, 단일 라우팅 관리점.
  • (실) Collector가 단일 장애점(SPOF)이 됨 → 서비스는 export 실패 시 graceful degrade로 영향 차단.