PagerDuty와 AWS DevOps Agent로 인... 노트

PagerDuty와 AWS DevOps Agent로 인시던트 해결 가속화

운영 환경에서 무언가 문제가 발생하면 빠르게 알 수 있습니다. 하지만 피해가 확산되기 전에 왜 문제가 발생했는지 이해하는 것이 어려운 부분입니다. Site Reliability Engineering(SRE) 팀이 가장 많은 시간을 잃는 부분이 바로 이 지점입니다. 새벽 2시에 알림을 받았던 마지막 순간을 생각해 보세요. 알림은 무언가 문제가 발생했다는 것을 알려줄 뿐, 왜 그랬는지에 대한 정보는 없었습니다. 당신은 네 개 또는 […]
CdXz5zHNQW_R4YhApekS4.png