インシデントの検出、対応、学習がすべてGrafana Cloud上でできます
GrafanaのIncident Response & Management(IRM)ツールは、インシデントのワークフローを簡素化し、ツールの管理ではなくインシデントの管理に集中できるようにします。
インシデント管理スタックによって、以下のことが可能になります:
- 本番システムの問題や変更を迅速に検出
- アラートを適切なチームに簡単に通知
- あらゆる深刻度のインシデントの報告、タスクの割り当て、コミュニケーションの自動化
- サービス、チーム、地域を横断したインシデントに関する実行可能な洞察を特定
Grafana CloudでIRMを使うのはなぜ?
一元管理し、アラートに対応するためのシングルビュー
Grafanaのアラートページは、Grafanaで管理されるアラートとPrometheus互換データソースにあるアラートを一か所で一元管理します。複数のページを見る必要がないため、チームの問題の特定と解決能力が向上します。
インシデント管理のルーティンタスクを自動化
インシデントツールを使って、役割を迅速に割り当て、チャットオペレーション/UIから学んだことをドキュメント化し、GitHub、Slack、Google Suiteなどのお気に入りのツールと統合します。
オンコールスケジュールを作成・管理
開発者ファーストのワークフローにより、オンコールスケジュールを簡単に作成・管理し、直感的なAPIを用いてエスカレーションを自動化できます。すべてが統合されており、既存のアラートソースやモニタリングツールと連携します。
既存のツールセット内で作業
GrafanaのIRMスイートは、タスク管理、チャットOps、ステータスページ、アラート用のツールとシームレスに統合されます。
Grafana IRMを始めるのは簡単です
2
ツールを接続(推奨)
Slackのようなお気に入りのアプリに統合を設定し、関連するチャンネルにGrafanaインシデントチャットボットを追加します。
3
通知を設定
各ユーザーが通知を受け取る方法を決定し、エスカレーションを作成します。
4
オンコールスケジュールの設定とインシデントの宣言を開始
UI内でオンコールのスケジュールを確立し、最初のドリルインシデントを報告します。