災害時などの耐障害性を検証、Dropboxが「データセンターの接続を断つ」テストで得た成果

今回は「災害時などの耐障害性を検証、Dropboxが「データセンターの接続を断つ」テストで得た成果」についてご紹介します。

関連ワード (ストレージ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 クラウドファイルストレージサービスを提供しているDropboxが、自社の災害対応能力を検証するために、同社の最も重要なデータセンターを完全にオフラインにするテストをどのように実施したかを紹介している。

 同社は、2015年頃にAmazon Web Services(AWS)からコンピューティングインフラを全面的に自社インフラに移行した後、独自のストレージシステム「Magic Pocket」の運用を開始している。米国のサンアンドレアス断層からそう遠くない場所に位置するサンノゼデータセンター(SJC)で、「高度に集中化」した体制を実現した。

 Dropboxは、サンノゼデータセンターの重要性の高さから、このリージョンや「メトロ」(リージョンをさらに分割したDropbox独自の管理単位)がダウンした場合に、同社のサービスのグローバルな可用性にどんな影響が及ぶかを確認したいと考えた。このため同社は、2021年11月に、SJCのデータセンターに接続されているファイバーネットワークの「プラグを物理的に抜く」ことによって、その耐障害性をテストすることにした。

 このプロジェクトを実施したチームは、テストについて詳しく説明するブログ記事の中で、「世界的に自然災害が増えており、当社のデータセンターにそのような事態が起きたときの潜在的な影響について検討することが重要だ」と述べている。

 同社が保管しているデータには、ファイルの内容そのものと、ファイルやユーザーのメタデータの2種類がある。Magic Pocketは、前者のコンテンツファイルをブロックに分割して、複数の異なるリージョンのインフラにレプリケート(複製)する。このシステムは、各データセンターが独立して同時にブロックデータを提供するように設計されており、いずれかのデータセンターがダウンするような事態でも事業への影響を最小限に抑えられる。いわゆる「アクティブ/アクティブ」なシステムだ。

 Dropboxはもともと、メタデータのスタックにも、同様のアクティブ/アクティブなアーキテクチャーを採用することを検討していた。しかし当時、同社のメタデータのメインMySQLデータベースはSJCに置かれており、このデータベースのフェイルオーバー、アクティブ/パッシブな機能のテストは適切に行われていなかった。同社はSJCのデータベースが、別の場所にあるパッシブなデータセンターにレプリケートされたMySQLデータベースに、正常にフェイルオーバーされるかどうかをテストしたいと考えた。2015年に行われたフェイルオーバーのテストは成功だったが、その後、同社のエンジニアは、メタデータにアクティブ/アクティブなアーキテクチャーを採用することはブロックストレージの場合よりも困難であることに気づいた。

 そのため同社は、メタデータにはアクティブ/パッシブなアーキテクチャーを採用するという判断を下し、その代わりに、2019年から頻繁にフェイルオーバーのテストを実施し始めた。

 しかしその後、2020年5月にDropboxのフェイルオーバーツールに「重大な障害」が発生して、大規模な機能停止が起こり、47分間のダウンタイムが発生するという事態が起きた。同社は既存のフェイルオーバーのツールとプロセスに関する緊急監査を実施するとともに、新たに7人の専任スタッフからなる災害復旧チームを発足させた。同チームは、2021年末までに目標復旧時間(RTO)を大幅に短縮するという目標を掲げた。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
大分県と富士通、移住・ワーケーションの協定締結–従業員の遠隔勤務が可能に
IT関連
2021-03-26 23:09
ヤンマーエネルギーシステム、ウェアラブル端末を活用した遠隔技術支援サービスを提供
IT関連
2021-07-01 05:43
クレディセゾンがDX実績を報告–内製開発システムを続々と導入
IT関連
2023-12-22 03:49
2024年における世界のIT支出は5.3%増–Forrester予測
IT関連
2024-01-23 20:25
VR空間で短尺アニメを作れる「AniCast Maker」、Oculus Quest向けに配信 エイベックスとVRの第一人者・GOROman氏の会社がタッグ
企業・業界動向
2021-04-11 13:55
コピーライターの「思考プロセス」学習–電通ら、広告コピー作成ツールを開発
IT関連
2024-08-07 22:37
HashiCorp、「Boundary 0.15」をリリース–Session recording保存ポリシーを追加
IT関連
2024-02-09 09:53
GNOMEとMonoとXamarinの開発者Miguel de Icaza(ミゲル・デ・イカザ)氏がマイクロソフト退職を発表
Microsoft
2022-03-07 00:24
テキストアドベンチャー「AI Dungeon」のLatitudeが「無限の物語」を生み出すゲーム制作のために3.5億円調達
人工知能・AI
2021-02-07 06:55
パソナ、生成AIツールの基礎知識を学べる「デジタル人材育成プログラム」提供–MSと連携
IT関連
2024-05-09 20:37
Epic Gamesが楽曲販売プラットフォームBandcampを買収、音楽分野へ進出
IT関連
2022-03-04 11:55
ビデオ会議の相手は本物か? ディープフェイクを見破る簡単な方法
IT関連
2022-08-19 01:30
Zoomの伝道師が語る「これからのコミュニケーションの在り方」
IT関連
2022-11-26 00:56
「シン・エヴァ」冒頭のYouTube公開、3日前から500人が待機中 「座席を指定してスイッチ」
くらテク
2021-03-05 21:27