RSS AWS DevOps ブログ
フォロー
DatadogとElasticsearchにおける根本原因分析をAWS DevOps Agentで自動化
現代の分散システムは、数十個のマイクロサービス、メッセージキュー、イベントストリームを経由してビジネストランザクションをルーティングします。メッセージの処理に失敗した場合や、処理がSLAのしきい値を超えた場合、トラブルシューティングには、Elasticsearchのようなツールからのログ、Datadogからのメトリクス、AWS CloudTrailにおけるインフラストラクチャの変更イベントを相関させる必要があります。それぞれ異なるクエリを持つ異種バックエンド間で、これらのシグナルを手動で相関させることは […]