Google Cloudでのクラウド破産をAIが警告、抑止。「Cost Anomaly Detection」パブリックプレビュー
今回は「Google Cloudでのクラウド破産をAIが警告、抑止。「Cost Anomaly Detection」パブリックプレビュー」についてご紹介します。
関連ワード (分析、監視、要因等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
Google Cloudは、AIを活用してクラウドにかかるコストの異常検知を行う新サービス「Cost Anomaly Detection」をパブリックプレビューとして公開しました。
クラウドは一般にサービスを使った分だけ料金が発生する従量課金制を採用しています。そのため、想定していなかったような大量のリクエストの発生や意図せず発生してしまった大量のデータの転送などによって、想定よりも過大な料金が発生してしまう場合があります。
ITエンジニアの間では、この現象を少し大げさに「クラウド破産」と呼ぶこともあります。
今回パブリックプレビューとなった「Cost Anomaly Detection」はGoogle Cloudのbilling consoleに追加された新機能で、AIが異常なコスト増加を検知して警告を発し、原因分析などを支援してくれるというものです。
1時間毎にコストを監視し、異常コスト検知
Cost Anomaly Detectionは過去のデータと季節性などを基にコスト発生のパターンを特定した上で、プロジェクトごとに1日当たりの発生コストを予測します。その上で、実際に発生しているコストを1時間ごとに監視し、予測と実際の乖離がないかを監視してくれます。
乖離が発生した場合、Cost Anomaly Detectionダッシュボードでスパイクまたはアノマリーとして識別されます。
コスト発生の要因を分析、アラートのカスタマイズも
検出されたアノマリーに対して、コスト発生の主要因をリストアップした「Root cause analysys」(根本原因分析)画面が示されます。これにより意図しないコスト発生を迅速に是正できるようになります。
アノマリーを検知しアラートを発する閾値や、アラートとしてPub/Subやメールなどどのような手段でアラートを通知するかなどはカスタマイズ可能となっています。
Cost Anomaly Detectionは、コスト発生のパターンを月ごとや季節性の変動だけでなく、日ごとや週ごとの変動に対してもAIが学習し、誤検知の可能性を減らしていくことができるとされています。
また検知されたアノマリーごとに、それが本当に異常が発生したモノなのか、あるいは実際には計画の範囲内であったのかをフィードバックすることもでき、AIはこのフィードバックも学習することで将来のアノマリーの評価の正確さの向上に役立ててくれます。
ちなみにAWSでも以前から「AWS コスト異常検出」機能が提供されています。