クラウドフレアの大規模障害、原因はアーキテクチャーの変更

今回は「クラウドフレアの大規模障害、原因はアーキテクチャーの変更」についてご紹介します。

関連ワード (ネットワーク等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 コンテンツ配信ネットワーク(CDN)のCloudflareは米国時間6月21日、同日に発生した大規模障害について原因を発表し、謝罪を表明した。障害は保守性を重視する新しいアーキテクチャーへの移行作業中に発生したとしている。

 同社によると、障害は東京や大阪を含む世界19カ所のデータセンターを結ぶ内部ネットワークを「Multi-Colo PoP(MCP)」と呼ぶ新しいアークテクチャーの構成に移行する作業中に発生した。MCPは、内部ネットワークにメッシュを構成する追加的なルーティングといい、これによって顧客サイトへの接続性を損なうことなく保守作業効率を高められるため、18カ月をかけて実装を準備してきたとしている。

 移行作業は、協定世界時(UTC)の6月21日午前3時41分(日本時間同日午後12時41分)に開始し、19カ所のデータセンターに展開した午前6時27分(日本時間午後3時27分)に通信障害が発生した。午前6時58分(日本時間午後3時58分)に設定を元に戻す復旧作業に着手し、午前7時42分(日本時間午後4時42分)に復旧作業を終え、午前8時(日本時間午後5時)に障害対応を完了したという。

 障害の影響が及んだのは同社ネットワークの4%だったものの、通信リクエストでは50%に及んだといい、世界各地でCloudflareのサービスを利用している膨大なウェブサイトへのアクセスなどが一時できなくなった。

 同社は、MCPへの移行作業手順に問題があったとして、障害の影響を受けた顧客に謝罪した。なお、MCPはサービスの可用性を高める重要なものだとし、再発防止のために各種作業手順などを見直して慎重に移行を行っていくとしている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
栄養価不足などを調べられる即時尿検査サービス開発のユーリアが5500万円調達、6月の製品リリース目指す
IT関連
2022-03-11 12:13
消費者団体が13歳以下の子ども向けInstagramの開発中止をフェイスブックに要望
ネットサービス
2021-04-20 15:59
コロナワクチン接種、自治体の8割が11月までに完了か JX通信社調べ
ネットトピック
2021-07-28 16:47
デジタル庁旗艦プロジェクト「電子インボイス」の可能性
IT関連
2021-08-21 15:02
避難所の“密”を防ぐ「ダンボール・スリープカプセル」、年内登場
くらテク
2021-06-30 22:55
ブロックチェーンブリッジのWormhole、ハッキング被害で370億円超相当流出
IT関連
2022-02-05 15:21
ノッチ縮小が期待のiPhone 13、製造台数は最大2割増し? ワクチン接種開始で需要増見込む
IT関連
2021-07-16 13:43
インフォマティカ、オールインワンでマスターデータを管理する「Customer 360 SaaS」発表
IT関連
2021-01-19 23:08
マイクロソフト、ソースコードをAIが読み込んで自然言語で説明してくれる「Copilot Explain」を開発中。GitHub Copilotは今夏に正式サービスへ。Microsoft Build 2022
GitHub
2022-05-26 05:08
インテル、経営トップ交代へ–元CTOのP・ゲルシンガー氏が新CEOに
IT関連
2021-01-15 20:16
Apple、屋内マップに羽田空港を追加
IT関連
2021-07-08 14:43
第1回:ソフトウェアベンダーへの不正アクセスを検証する
IT関連
2021-07-06 00:35
データの不整合をいち早く見つける監視サービス「Soda」
ソフトウェア
2021-04-03 16:06
Web3が広くもたらす「ネットワーク効果」とは–イーサネット発案者メトカーフ氏が語る
IT関連
2022-05-14 11:29