障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開

今回は「障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開」についてご紹介します。

関連ワード (効率化、連絡、開始等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


クラウド対応のログ可視化ツールとして知られる「Grafana」や監視システム「Prometheus」などを開発し提供するGrafana Labsは、障害発生時に担当者へのオンコールを自動化できるオンコールマネジメントソフトウェア「Grafana OnCall」をオープンソースで公開したことを明らかにしました。

Introducing the newest member of our open source family: Grafana OnCall OSS brings on-call management to the open source community #grafanaconline #oncallmanagement https://t.co/Nkq8frQx2r

— Grafana (@grafana) June 14, 2022

Grafana OnCallは、昨年(2021年)11月に買収を発表したAmirが開発したソフトウェアで、発表と同時にGrafana Cloudのクラウドサービスとしても提供が開始されました。

今回それがオープンソースとして公開されたことになります。

各種監視ツールと連係、スケジュール設定による担当者への連絡など自動化

Grafana OnCallは、システム監視ツールから受け取ったアラートが、あらかじめ設定されたレベルを超えた場合に、自動的に運用担当者にSMSやチャットツールなどで連絡を行う、オンコールマネジメントと呼ばれる分野のソフトウェアです。

連携できるシステム監視ツールはGrafanaやPrometheusはもちろん、 Datadog、New Relic、AWS SNS、AlertManager、Zabbixなど多岐にわたり、連絡用のツールもSMSやSlackをはじめとする各種チャットツールなどに対応しています。

どのような場合にオンコールを発するかの条件は、IF文形式で設定することができます。

fig

オンコールの連絡先は、あらかじめ設定されたその日その時間の担当者にスケジュールを基に行われるようになっています。

fig

また、アラートの自動グルーピング機能によって、障害が継続しているあいだずっとアラートが鳴り続ける、いわゆるアラートストームを防止する機能も備えています。

これらの機能によって、別々の監視ツールからそれぞれ発せられるアラートを統合的に管理できるようになり、またあらかじめ決められたオンコール担当者に連絡を振り分ける作業も自動化されるなど、監視業務の自動化と効率化を進めることができるようになるとされています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
プロトレーナーによるマンツーマンのダイエット指導をオンラインで提供するWITH Fitnessのウィズカンパニーが1億円調達
IT関連
2022-02-03 03:21
日蓮生誕800年 異例のリモート大法要 千葉・鴨川
IT関連
2021-02-20 06:16
スペースXが「米国のほうき」でさらに48基のスターリンク衛星を打ち上げ
IT関連
2022-03-12 17:52
密漁防止にドローン活用 AIで識別 赤外線カメラも
ロボット・AI
2021-05-18 07:19
次なる成長の弾は何か?–デルの幹部は何と答えたか
IT関連
2023-03-18 21:31
「使用中のオープンソースで継続的にアップデートしていない」9割
IT関連
2022-05-21 08:09
NEC、ServiceNowの法務クラウドサービスを国内初導入–法務領域DXを加速
IT関連
2024-02-06 06:47
ヴイエムウェア、「Tanzu Advanced」提供–DevSecOpsを実現
IT関連
2021-01-15 04:05
仕事はハイブリッド形態、それともオフィスで?–IT分野では在宅ワークの方が高収入
IT関連
2022-07-08 11:14
インテルの次世代プロセッサーはアップルのチップを凌駕する–CEOが見せた自信
IT関連
2023-09-27 15:30
NTTデータ、世界6カ国に先進技術の研究開発拠点を開設
IT関連
2022-08-21 20:11
CSIRTの歴史的変遷で探るインシデント対応の課題と解決の道のり
IT関連
2021-07-05 21:40
富士通CTと日本リーテック、伐採作業を効率化するAIアプリを実証
IT関連
2021-07-14 13:20
NTTドコモとNTT Com、「金沢マラソン2022」のリモート応援環境を提供
IT関連
2022-10-26 12:12