インシデント発生時のチーム対応を支援する「Grafana Incident」、無料でGrafana Cloudが提供。SlackやGitHubなどと連携
今回は「インシデント発生時のチーム対応を支援する「Grafana Incident」、無料でGrafana Cloudが提供。SlackやGitHubなどと連携」についてご紹介します。
関連ワード (支援、自動的、途中等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
Grafana Labsは、インシデント発生時にチームでのインシデント対応を支援するクラウドサービス「Grafana Incident」をGrafana Cloudで無料提供することを発表しました。
Read more about Grafana Incident, it's features, and how to get started here:https://t.co/4Rmqujt2oh
— Grafana (@grafana) September 13, 2022
システム運用中に何らかのインシデントが発生した場合、インシデントの状態把握、原因の調査、インシデントからの復旧、ユーザーや関係者への報告など、それぞれの役割をアサインされた担当者がチームとなってインシデント対応にあたることになります。
Grafana Incidentは、これらのインシデント時に要求される担当者のアサインとそれぞれの業務の支援、進捗の共有などを支援し管理できるクラウドサービスです。
インシデント宣言、専用会議室の設定、担当者のアサイン、タスク管理など
Grafana Incident上でインシデント発生が宣言されると、自動的にそのインシデント専用のZoomやGoogle Meetのオンライン会議室、Slackの専用チャンネル、Google Driveのフォルダなどが設定され、調査担当、管理者(Commander)など担当者のアサインも行うことになります。
また、チャットボットがGrafana Incidentのコマンドライン上で関連するダッシュボードへのリンクを投稿。GitHub Issueと同期し、Grafana Incident上でIssueの状況も把握できます。
管理者はタスクマネージャを利用して各担当者へタスクを割り振り、タスクの進捗を管理できます。
これらの機能によってタスクの管理と進捗、インシデントの状況などをGrafana Incidentで管理できるとともに、Grafana Incident上では「Activity timeline」と呼ばれる機能で、何が起きているのか、何が行われているのかが時系列でまとめられます。これにより途中からインシデント対応チームに参加したメンバーもこれまでの経緯を容易に把握可能です。
インシデントが解消したあとは、ポストモーテム(事後検証)プレゼンテーション機能が、インシデントの振り返りとまとめを支援してくれます。
Grafana IncidentはGrafana Cloudのフリーティアを含めた全てのユーザーが無料で利用できるとのことです。インシデント対応のベストプラクティスを体験し、参考にできるサービスではないでしょうか。
関連記事
- 障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開