クラウドフレアの大規模障害、原因はアーキテクチャーの変更

今回は「クラウドフレアの大規模障害、原因はアーキテクチャーの変更」についてご紹介します。

関連ワード (ネットワーク等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 コンテンツ配信ネットワーク(CDN)のCloudflareは米国時間6月21日、同日に発生した大規模障害について原因を発表し、謝罪を表明した。障害は保守性を重視する新しいアーキテクチャーへの移行作業中に発生したとしている。

 同社によると、障害は東京や大阪を含む世界19カ所のデータセンターを結ぶ内部ネットワークを「Multi-Colo PoP(MCP)」と呼ぶ新しいアークテクチャーの構成に移行する作業中に発生した。MCPは、内部ネットワークにメッシュを構成する追加的なルーティングといい、これによって顧客サイトへの接続性を損なうことなく保守作業効率を高められるため、18カ月をかけて実装を準備してきたとしている。

 移行作業は、協定世界時(UTC)の6月21日午前3時41分(日本時間同日午後12時41分)に開始し、19カ所のデータセンターに展開した午前6時27分(日本時間午後3時27分)に通信障害が発生した。午前6時58分(日本時間午後3時58分)に設定を元に戻す復旧作業に着手し、午前7時42分(日本時間午後4時42分)に復旧作業を終え、午前8時(日本時間午後5時)に障害対応を完了したという。

 障害の影響が及んだのは同社ネットワークの4%だったものの、通信リクエストでは50%に及んだといい、世界各地でCloudflareのサービスを利用している膨大なウェブサイトへのアクセスなどが一時できなくなった。

 同社は、MCPへの移行作業手順に問題があったとして、障害の影響を受けた顧客に謝罪した。なお、MCPはサービスの可用性を高める重要なものだとし、再発防止のために各種作業手順などを見直して慎重に移行を行っていくとしている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
時系列データベースのクラウド版で収益化するTimescaleがシリーズBで約43.6億円を調達
ネットサービス
2021-05-09 17:43
損保ジャパン、対話型AIでコールセンター受電能力を世界最大級に増強
IT関連
2023-01-28 06:12
Zoom、約1300人の人員削減へ–従業員の15%
IT関連
2023-02-09 12:12
ローカル環境を汚さない開発環境Devbox/AWS SIer世界一にクラスメソッド/VSCode WebでPythonの実行やデバッグ可能にほか、2022年12月の人気記事
編集後記
2023-01-06 03:00
テレビ局依存、終焉の兆し テレワーク・業績不振でオフィスの移転相次ぐ芸能界
IT関連
2021-02-10 12:30
市民/職員を最初から最後までデジタルでつなげる基盤–ServiceNow Japan
IT関連
2022-05-24 03:38
ジョルダン、地域活性化プラットフォームを構築–街のにぎわい創出図る
IT関連
2022-06-19 14:54
TumblrがZ世代のクリエイターのためのサブスクサービスPost+を開始
ネットサービス
2021-07-24 12:29
第49回:列伝9人目「内製型ひとり情シス」
IT関連
2022-09-21 07:21
ソフトウェア開発で続くセキュリティ軽視–業界に求められる迅速な変化
IT関連
2022-04-14 12:43
Microsoft、「Surface Laptop 4」発売 AMDの13.5インチが12万8480円から
製品動向
2021-04-15 08:51
セキュアとヘリックス、クラウド型ウェアラブルカメラを提供開始–建設現場などのDXを推進
IT関連
2022-08-17 11:30
東証、システム障害再発防止策で報告書 当日の復旧を前提に
IT関連
2021-03-29 09:44
NHK予算、2年連続で全会一致承認ならず 放送とネットのビジョン見えず
IT関連
2021-04-15 19:07