RSS AWS DevOps ブログ
フォロー
PagerDutyとAWS DevOpsエージェントでインシデント解決を加速する
本番環境で何か問題が発生した場合、すぐにわかります。被害が広がる前に、なぜ問題が発生したのかを理解することが難しい部分です。そこで、サイト信頼性エンジニアリング(SRE)チームは最も時間を失います。最後に午前2時にアラートを受けた時のことを考えてみてください。アラートは何か問題が発生したことを示していましたが、その理由は示されていませんでした。あなたは4つ、または[...]