DZone.com의 RSS
팔로우
쿠버네티스에서 주목해야 할 주요 지표
서론
만약 여러분이 쿠버네티스 사고에 휘말려, 미스터리한 5xx 에러와 함께 프로덕션 마이크로서비스가 실패하는 상황을 경험해본 적 있다면, 그 상황이 어떤지 잘 아실 겁니다. 경고는 울리고, 대시보드는 크리스마스 트리처럼 번쩍이며, 팀은 스택의 모든 레이어에서 쏟아지는 지표들을 파악하기 위해 정신없이 움직입니다. 이러한 상황은 '언제' 발생할 것인가의 문제가 아니라, '언제' 발생할 것인가의 문제입니다.
이러한 압박감 속에서 진정한 도전은 단순히 디버깅하는 것만이 아닙니다. 어디를 봐야 할지 아는 것이 중요합니다. 쿠버네티스를 삶의 일부로 여기는 숙련된 SRE(사이트 신뢰성 엔지니어)와 기술 창업자에게는, 올바른 신호를 빠르게 찾아내는 능력이 5분 만에 해결할 수 있는 문제와 5시간 동안의 서비스 중단을 가르는 중요한 차이를 만듭니다.