Grafana OnCall

オンコール管理の
最も簡単な方法

schedules

Grafana OnCallは、エンジニア向けに特別に設計されたシンプルなワークフローとインターフェースを通じて、オンコール管理の負担を軽減する使いやすいオンコール管理ツールです。この製品は、Grafana OnCall OSSプロジェクトに基づいています。

管理すべきはインシデントであり、ツールではありません。

チームはもはや、Grafana、Prometheus、Alertmanagerなどからの別々のアラートを管理する必要はありません。すべてが統合されており、既存のアラートソースやモニタリングツールと連携して動作します。

適正な価格設定。

Grafana OnCallを実際に*使用しているユーザーにのみ料金が発生します。

*今年度のエンジニアの人数から予測される使用量ではありません。数ヶ月前にアカウントを作成したことを忘れているユーザーのためでもなく、また、仕事をしているふりをしながら、実は冷蔵庫の温度を監視するために個人的なダッシュボードを作っているだけの同僚のためでもないです。

エンジニアリングチーム向けに構築

開発者ファーストのワークフローにより、直感的なAPIを用いてオンコールスケジュールを簡単に作成・管理し、エスカレーションを自動化できます。

schedules

オンコールスケジュールの
作成と管理

カレンダーを通じてオンコールスケジュールを作成・管理します。オンコール時間をスケジュールするには、チームメンバーのGrafanaユーザー名をイベント名としてカレンダーイベントを作成します。このアプローチにはいくつかの利点があります:

  • 設定と構成が非常に迅速で、Grafana OnCallをすぐにテストできます。 - オンコールスケジュールの管理は、チームがすでに慣れ親しんでいるツールとワークフローで行われるため、手間が軽減されます。

柔軟なルーティングによる自動エスカレーション

Grafana OnCallは、障害が適切に対処されるように、柔軟なエスカレーション作成UIを提供します。これには、IF、ELSE IF、ELSEのロジックを使用できる強力なルーティングオプションが含まれ、アラートのタイプに基づいて調整が可能です。

escalations
centralized

アラートグループの集中管理ビュー

Grafana OnCallは、Grafana Cloudおよびよく知っているGrafana UI内に、すべてのアラートを含む集中管理ビューを提供します。これにより、アクティブなアラートの状態をすぐに確認・更新し、解決済みの古いアラートを検索できます。

インテグレーション

Grafana OnCallは、Datadog、New Relicなどを含む幅広い監視システムをサポートしています。

schedules

簡単に始めることができます

完全な実装の詳細とベストプラクティスについては、

2

通知の設定

各ユーザーがどのように通知を受け取るかを決定します。

3

エスカレーションポリシーの決定

エスカレーションチェーンを使用して、順序立てたエスカレーション手順を決定します。

4

オンコールスケジュールの設定

任意のカレンダーにiCalアドレスを使用して、ユーザーのオンコール時間をスケジュールします。

Grafana Cloud Incident Response & Management (IRM)

検出、対応、学習。Grafana’s Incident Response & Management (IRM)ツールは、インシデントのワークフローを簡素化し、ツールの管理ではなくインシデントの管理に集中できるように支援します。これにより、迅速かつ効果的な対応が可能になり、インシデントから学び、改善を図ることができます。

Cloud Free

永久無料
アーリーステージや小規模チームに最適で、月間アクティブIRMユーザー数は3人までです。
始めるための最も簡単な方法

Cloud Pro

従量制
アクティブIRMユーザーが3人を超え、8x5のサポートを必要とする成長中のチームに最適です。

Cloud Advanced

プレミアム・バンドル
アクティブIRMユーザーが3人を超え、24時間365日のサポートを必要とするチームに最適です。

Grafana OnCallについてもっと知る

Grafana Alerting

アラートを使用することで、問題が発生した直後にシステムの問題を把握できます。堅牢で実用的なアラートは、問題の特定と迅速な解決を助け、サービスへの影響を最小限に抑えます。

Grafana Incident

Grafana Incidentは、一般的なタスクを自動化し、チームが作業するための専用の場所を提供することで、インシデント管理を容易にします。

始める準備はできていますか?