「AIOps」とは? IT運用における人工知能の重要性–後編

今回は「「AIOps」とは? IT運用における人工知能の重要性–後編」についてご紹介します。

関連ワード (運用管理等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 前回の記事では、組織がAIOpsを導入する必要がある背景やAIOpsの定義について説明しました。今回は、AIOpsの導入に必要な5つのステップと、AIOpsを導入するメリットについて説明します。

 AIOpsの主な用途としては、パフォーマンス監視、異常検知、根本原因分析、ITサービス管理、自動化などが挙げられます。AIOpsには、図2に示すような複数の段階があります。

 各段階には、生データの収集から変換や分析を経て、問題を修正するためのアクションの実行に至るまで、明確な目的があります。定量的な観点としてAIOpsは、IT環境における問題の検出、調査、解決にかかる時間の短縮を目指します。

 AIOpsの最初の段階は、サーバー、ネットワーク、アプリケーションなど、さまざまなソースシステムからデータセットを収集することです。問題の検出と解決にかかる時間を最小限に抑えるには、できるだけリアルタイムにデータを取得することが重要です。この要件は、ストリーミングインジェストをサポートすることが重要であることを意味します。

 また、履歴データを残すことも重要です。履歴データは、AIOpsの機械学習モデルを改良し、キャパシティープランニングやセキュリティ侵害の調査など、他のタスクをサポートするために活用できます。

 データを取り込む上でもう一つ重要な側面は、集約したデータの正規化または標準化です。ソースシステムによっては、同じ種類のデータに対して微妙に異なるデータ構造を使用している場合があり、データを共通の構造にマッピングして、後の段階で行う高度な分析をサポートすることが重要です。

 AIOpsの第2段階は、データの統合です。これは、異なるソースからのデータを関連付けることで、各ソースシステムから得られる多様な情報に基づいて、根本原因の分析を実現するということを意味します。

 例えば、あるアプリケーションでは、アプリケーションのパフォーマンスと負荷に関する一連のメトリクスと、アプリケーション処理における重要なイベントを記述したログメッセージが生成される場合があります。メトリクスとログを時系列で共通のダッシュボードにそろえることで、イベントと依存関係の相関関係のパターンを見つけやすくなり、アプリケーションパフォーマンス監視(APM)の洞察をより良く伝えることができます。

 イベントの相関は、システムの状態を把握するために有効なイベントを特定するプロセスです。相関の目的は、膨大な数の注目すべきイベントの流れの中から、興味深いイベントの「点」を関連付けることです。例えば、あるネットワークデバイスがトラフィックの増加を示すメトリクスを報告し、その後にロードバランサーが同様の増加を報告したとします。

 次に、ロードバランサーのクラスター内のサーバーからCPUとメモリーの使用率が異常に高いという報告があったとします。通常ロードバランサーは、CPU使用率が定義されたしきい値を超えると、クラスターに仮想マシン(VM)を追加することになっています。しかし、そうならない場合は、リソース不足を解消するために早急な対策が必要です。

 ロードバランサーがクラスターのVM数を増やすことに失敗するのは、イベントの相関関係によって問題を検出できる例であり、相関関係にあるデータに対して、パターンマッチングやその他のAI技術を適用した例でもあります。人間がパターンを定義することもできますが、機械学習のアルゴリズムは、大量のITデータから関心のあるパターンを特定する異常検出やその他の予測分析に長けています。こうした技術によってAIOpsシステムが学習し、検出できる問題の範囲を拡大することができます。

 AIOpsパイプラインの最終段階は、検出された問題を修正することです。ロードバランサーに障害が発生した例では、クラスターにリソースを追加することができます。もし、この事象が進行中のセキュリティ侵害に関連している場合、AIOpsシステムはネットワークポートをブロックし、セッションを終了させ、攻撃者が悪用するシステムの既知の脆弱性にパッチを充てるなどの措置を講じることができます。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
GoogleのFitbit買収が完了 日本の公取委も承認
企業・業界動向
2021-01-17 21:14
中国でSaaSが普及しない理由–“SaaS不要論”の原因を探る
IT関連
2023-08-19 12:25
ITとOTを知るフォーティネットの田井新社長–セキュリティ対策の相違点
IT関連
2022-08-24 17:24
Apple、顔を覆うマスクを着けたままFace IDで認証するときに、Apple Watchを使用してiPhone X以降のロック解除に対応した「watchOS 7.4」を配布開始
IT関連
2021-04-28 06:22
経営管理プラットフォーム「DIGGLE」に申請・承認機能–予算申請・承認をシステム上で完結
IT関連
2023-04-27 04:05
米国財務省、金融機関のクラウド採用において課題を指摘する、初のレポートを公開。透明性に欠け、少数の事業者への集中などの指摘
クラウド
2023-02-14 03:47
米政府機関、産業用システムに対する攻撃の典型的手口や対策を公開
IT関連
2022-09-29 01:42
凸版印刷、複数の異種ロボットで人物認識を可能にするAIシステムを開発
IT関連
2022-11-23 15:06
macOSで「Bartender 5」のトリガー機能を使う–特定条件でメニューバーアイコンを表示
IT関連
2023-11-15 18:16
任天堂Nintendo Switchの累計販売台数が1億354万台に到達、2017年3月の初代モデル発売から約5年で1億台突破
IT関連
2022-02-05 06:56
ユーザーが自らの閲覧データをブロックするのではなく収集、管理、他者と集約し販売するツールを提供するDatacy
ネットサービス
2021-05-29 11:12
「Fedora 39」に「DNF5」をインストールするには–高速化したパッケージマネージャー
IT関連
2023-12-01 08:48
インテル、欧州に大規模チップ工場新設へ–まずドイツから
IT関連
2022-03-17 23:24
大胆に決断し、成果を生み出すリーダーになるために
IT関連
2022-03-03 04:31