Spotifyが全世界でログインできなくなった3月8日の障害について原因を報告。Google CloudのTraffic Directorの障害がgRPCライブラリのバグを踏んだと

今回は「Spotifyが全世界でログインできなくなった3月8日の障害について原因を報告。Google CloudのTraffic Directorの障害がgRPCライブラリのバグを踏んだと」についてご紹介します。

関連ワード (日午前、時間以上、機能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


音楽配信サービスのSpotifyは先週、2022年3月8日の18時頃(世界協定時。日本時間9日午前3時頃)から2時間以上、ログインができなくなるなどの障害がグローバルに発生していました。20時半頃には障害が収束し、正常化しました。

Spotifyのエンジニアリングチームは、この障害の原因についての報告を、ブログの記事「Incident Report: Spotify Outage on March 8」として公開し、Google CloudのTraffic Directorの障害が引き金であったことなどを説明しています。

fig

Google Cloud Traffic Directorの障害が引き金に

Spotifyのシステムはマイクロサービスでできており、サービス間でお互いを発見(Discovery)するために、多くはDNSベースのサービスディスカバリを利用していたものの、一部でEnvoyプロキシのxDS APIベースのGoogle Cloud Traffic Directorを採用していたとのこと。

そして3月8日にこのGoogle Cloudが提供するTraffic Directorに障害が発生。

これがgRPCを用いたクライアントライブラリのバグ、処理に失敗した際にチャネルにエラーを伝播していくというバグと組み合わさり、Spotifyのログイン処理に問題を引き起こしたと説明されました。

Spotifyのエンジニアチームはこの原因を発見し次第、障害が発生したシステムをDNSベースのサービスディスカバリへと設定変更し、正常な状態へと回復させました。

Spotifyは今後の対策として、今回の障害についてGoogle Cloudと協力して分析を行うとともに、障害発生をさらに早期に発見するための監視とアラート機能を強化するとのことです。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ポストコロナの新常識–ハイブリッドワーカーのためのセキュリティとは
IT関連
2023-07-04 14:55
ポケモンGOに「ニンフィア」参上、進化方法は2通り フェアリーイベント後半は“ブイズまつり”
くらテク
2021-05-26 11:32
ネットワンシステムズ、横浜市のガバメントクラウド共通基盤を構築
IT関連
2024-12-18 20:51
アークサーブ、新戦略「ハイスピード ハイレゾリューション」で年率30%成長を実現
IT関連
2023-09-09 12:51
3万円超えの日経平均は「積立投資」に最適な暴れ馬–NYダウより上げも下げも大
IT関連
2021-02-16 03:02
ゲッティイメージズ、画像生成AIサービス「iStockの生成AI」発表–著作権侵害の心配なし
IT関連
2024-01-11 21:35
三菱UFJ銀行、TealiumのCDP導入でマーケティング施策を強化
IT関連
2024-06-15 13:00
SAS日本法人社長が説く「AI時代の人の意志決定力の磨き方」
IT関連
2024-07-27 18:44
HashiCorp、「Terraform」に継続的バリデーションやノーコードプロビジョニング–HashiConf Global 2022
IT関連
2022-10-09 06:33
ロジクール、よりリアルなビデオ通話ができるブース「Project Ghost」を開発中
IT関連
2023-02-02 23:02
ファイブアイズ、重要インフラ狙うロシア関連のサイバー攻撃に注意喚起
IT関連
2022-04-23 13:07
第3回:オブザーバビリティを組織変革のドライバーに
IT関連
2023-12-20 14:26
APACの企業、デジタルスキルトレーニングの必要性を認識も大半は未実施
IT関連
2022-04-07 23:49
データの価値をもっと引き出すAWSとセールスフォースの活用術
IT関連
2023-05-27 08:43