災害時などの耐障害性を検証、Dropboxが「データセンターの接続を断つ」テストで得た成果

今回は「災害時などの耐障害性を検証、Dropboxが「データセンターの接続を断つ」テストで得た成果」についてご紹介します。

関連ワード (ストレージ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 クラウドファイルストレージサービスを提供しているDropboxが、自社の災害対応能力を検証するために、同社の最も重要なデータセンターを完全にオフラインにするテストをどのように実施したかを紹介している。

 同社は、2015年頃にAmazon Web Services(AWS)からコンピューティングインフラを全面的に自社インフラに移行した後、独自のストレージシステム「Magic Pocket」の運用を開始している。米国のサンアンドレアス断層からそう遠くない場所に位置するサンノゼデータセンター(SJC)で、「高度に集中化」した体制を実現した。

 Dropboxは、サンノゼデータセンターの重要性の高さから、このリージョンや「メトロ」(リージョンをさらに分割したDropbox独自の管理単位)がダウンした場合に、同社のサービスのグローバルな可用性にどんな影響が及ぶかを確認したいと考えた。このため同社は、2021年11月に、SJCのデータセンターに接続されているファイバーネットワークの「プラグを物理的に抜く」ことによって、その耐障害性をテストすることにした。

 このプロジェクトを実施したチームは、テストについて詳しく説明するブログ記事の中で、「世界的に自然災害が増えており、当社のデータセンターにそのような事態が起きたときの潜在的な影響について検討することが重要だ」と述べている。

 同社が保管しているデータには、ファイルの内容そのものと、ファイルやユーザーのメタデータの2種類がある。Magic Pocketは、前者のコンテンツファイルをブロックに分割して、複数の異なるリージョンのインフラにレプリケート(複製)する。このシステムは、各データセンターが独立して同時にブロックデータを提供するように設計されており、いずれかのデータセンターがダウンするような事態でも事業への影響を最小限に抑えられる。いわゆる「アクティブ/アクティブ」なシステムだ。

 Dropboxはもともと、メタデータのスタックにも、同様のアクティブ/アクティブなアーキテクチャーを採用することを検討していた。しかし当時、同社のメタデータのメインMySQLデータベースはSJCに置かれており、このデータベースのフェイルオーバー、アクティブ/パッシブな機能のテストは適切に行われていなかった。同社はSJCのデータベースが、別の場所にあるパッシブなデータセンターにレプリケートされたMySQLデータベースに、正常にフェイルオーバーされるかどうかをテストしたいと考えた。2015年に行われたフェイルオーバーのテストは成功だったが、その後、同社のエンジニアは、メタデータにアクティブ/アクティブなアーキテクチャーを採用することはブロックストレージの場合よりも困難であることに気づいた。

 そのため同社は、メタデータにはアクティブ/パッシブなアーキテクチャーを採用するという判断を下し、その代わりに、2019年から頻繁にフェイルオーバーのテストを実施し始めた。

 しかしその後、2020年5月にDropboxのフェイルオーバーツールに「重大な障害」が発生して、大規模な機能停止が起こり、47分間のダウンタイムが発生するという事態が起きた。同社は既存のフェイルオーバーのツールとプロセスに関する緊急監査を実施するとともに、新たに7人の専任スタッフからなる災害復旧チームを発足させた。同チームは、2021年末までに目標復旧時間(RTO)を大幅に短縮するという目標を掲げた。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
NTT Com、“2nd GIGA”に備えたサービスを提供–生徒自身のデータ活用目指す
IT関連
2024-04-11 03:16
IBMはレガシーを捨てクラウドとAIに集中するも結果を出せず売上減
ネットサービス
2021-01-23 05:15
モバイルゲーム大手のKLab、脆弱性管理ツールで適切な対応体制を確立
IT関連
2023-02-10 23:51
日立造船、IoT基盤と連動するデータ分析/機械学習システムの運用を効率化
IT関連
2021-04-30 06:56
.NET MAUIがバージョン1.0に到達。C#/.NETのシングルコードベースでWin/Mac/iOS/Androidのネイティブアプリを開発可能に。Microsoft Build 2022
.NET
2022-05-25 14:38
ヴイエムウェア、国内でのゼロトラストセキュリティ推進体制を発表
IT関連
2021-07-01 11:37
コスパで勝負するクラウドストレージの中堅WasabiがシリーズCで約122億円調達
ネットサービス
2021-05-01 06:32
データプライバシーの未来–コンフィデンシャルコンピューティングや耐量子暗号に注目
IT関連
2021-03-31 05:57
エレコム製ルーターに脆弱性、「ウマ娘」はGII以下で体操服……7月6日のITトレンドをサクッとおさらい :ほぼ日刊ITトレンドワード
ネットトピック
2021-07-07 18:58
NEC、あしなが育英会と連携で「Canpass」開発–1万件以上の奨学金情報が検索可能
IT関連
2021-06-16 19:46
NASAのソフトウェアは地球でも有用–ダウンロードも可能なさまざまなプログラム
IT関連
2021-07-02 05:20
エンジニア採用育成支援サービス「TechTrain」を提供するTechBowlが1.3億円のプレシリーズA調達
IT関連
2022-01-28 16:41
アップルの最新アクセシビリティ機能は手足や声が不自由な人へさらに寄り添う
ヘルステック
2021-06-12 05:03
CISO意識調査に見る日本と世界のギャップ
IT関連
2021-06-18 02:59