クラウドフレアの大規模障害、原因はアーキテクチャーの変更

今回は「クラウドフレアの大規模障害、原因はアーキテクチャーの変更」についてご紹介します。

関連ワード (ネットワーク等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 コンテンツ配信ネットワーク(CDN)のCloudflareは米国時間6月21日、同日に発生した大規模障害について原因を発表し、謝罪を表明した。障害は保守性を重視する新しいアーキテクチャーへの移行作業中に発生したとしている。

 同社によると、障害は東京や大阪を含む世界19カ所のデータセンターを結ぶ内部ネットワークを「Multi-Colo PoP(MCP)」と呼ぶ新しいアークテクチャーの構成に移行する作業中に発生した。MCPは、内部ネットワークにメッシュを構成する追加的なルーティングといい、これによって顧客サイトへの接続性を損なうことなく保守作業効率を高められるため、18カ月をかけて実装を準備してきたとしている。

 移行作業は、協定世界時(UTC)の6月21日午前3時41分(日本時間同日午後12時41分)に開始し、19カ所のデータセンターに展開した午前6時27分(日本時間午後3時27分)に通信障害が発生した。午前6時58分(日本時間午後3時58分)に設定を元に戻す復旧作業に着手し、午前7時42分(日本時間午後4時42分)に復旧作業を終え、午前8時(日本時間午後5時)に障害対応を完了したという。

 障害の影響が及んだのは同社ネットワークの4%だったものの、通信リクエストでは50%に及んだといい、世界各地でCloudflareのサービスを利用している膨大なウェブサイトへのアクセスなどが一時できなくなった。

 同社は、MCPへの移行作業手順に問題があったとして、障害の影響を受けた顧客に謝罪した。なお、MCPはサービスの可用性を高める重要なものだとし、再発防止のために各種作業手順などを見直して慎重に移行を行っていくとしている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
世界PC出荷、2021年Q2は4.6%増–半導体不足の影響で伸び鈍化
IT関連
2021-07-14 03:52
「Windows Server 2022」が長期サービスチャネルで一般公開
IT関連
2021-08-23 13:44
ガートナーが示す、データ/分析責任者が注力すべき3つの最優先課題
IT関連
2023-02-15 03:14
HashiCorp、「HCP Waypoint」でテンプレートとアドオンを発表–新たなビジョンを明らかに
IT関連
2023-10-13 02:58
アニメ「進撃の巨人」、ファイナルシーズン Part 2をNHK総合で今冬放送
くらテク
2021-03-30 09:53
エネルギー効率1000倍・ノイズ100分の1に改善、高感度で広帯域な計測が可能な低消費電力磁気センサーを開発
IT関連
2022-02-23 13:06
リンガーハット、人事労務SaaSと社内システムをノーコードでデータ連携
IT関連
2024-02-15 19:16
グーグルがGlobalFoundriesと提携、チップ開発のオープンソース化に向け
IT関連
2022-08-06 08:54
さくらインターネット、経産省認可を受け生成AI向けクラウドを展開へ
IT関連
2023-06-17 21:12
AIで生成したプログラムの使用が招くリスク–考えられる法的責任
IT関連
2023-06-29 13:13
オフィス再開に向けて大手テック企業はそれぞれ柔軟なワークモデルを検討中
パブリック / ダイバーシティ
2021-06-13 01:52
内部脅威によるコスト上昇–内部者の過失はインシデントの大きな要因
IT関連
2022-02-01 07:35
「Slack」でメッセージの送信日時を設定するには
IT関連
2022-06-24 05:26
VRブラウザー「Firefox Reality」、提供終了–技術はIgaliaの「Wolvic」に継承
IT関連
2022-02-08 08:03