運用チームが災害時に現場にたどりつけなくても、止まらないシステムを作りたい。サイバートラストはBCP対策をどう作った?[PR]

今回は「運用チームが災害時に現場にたどりつけなくても、止まらないシステムを作りたい。サイバートラストはBCP対策をどう作った?[PR]」についてご紹介します。

関連ワード (社内、運用、部部長等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


顧客向けに止められないさまざまなサービスを24時間365日提供しているサイバートラスト。

同社は、これらの高可用性が求められるシステムの一部に、クラスタリングソフトウェア「CLUSTERPRO X」を採用したことを明らかにしました。

具体的には、東京および東京から十分離れた地域のそれぞれに、仮想化ハイパーバイザ「KVM」とLinux OSを用いた数十台のシステムを配置し、CLUSTERPRO Xを用いて両者をクラスタ化。

もしもメインのシステムである東京が障害や災害などでサービス提供に支障が発生したとしても、自動的に遠隔地のシステムに切り替えることで高可用システムを実現しています。

CLUSTERPRO Xでクラスタリングシステムが完結する

同社情報システム部部長の吉藤英明氏はCLUSTERPRO X採用の理由を「障害検知からフェイルオーバー、DNSの切り替えまで、クラスタリングに関わるシステム全体がCLUSTERPRO Xだけで完結すること、そしてCLUSTERPRO X自身が市場に登場してから20年以上使われてきた長い実績を持つこと」と説明しました。

fig写真左から、サイバートラスト OSS事業本部 Linuxサービス部 吉田俊輔氏、管理本部 情報システム部 杉山元正氏、管理本部 情報システム部 部長 吉藤英明氏

同社は今回の高可用システムを構築する前から、多数の物理サーバ、仮想サーバを用いてサービスを運用し、サービスの継続性も維持してきました。

今回、それを仮想化によりサーバを集約、整理するのと同時に、CLUSTERPRO Xを用いた遠隔地とのクラスタリングを構築したのです。

同社がサービスの冗長性をどのようなシステムで構築したのか、ポイントを見ていきましょう。

KVM、Linux、そしてCLUSTERPRO Xによる構成

あらためて高可用性を実現したシステム構成を見てくと、仮想化に用いたハイパーバイザはKVM。同社の情報システム部 杉山元正氏は、KVMを選択した理由を「商用製品では、何かしら細かい設定をしようとすると有償でのオプションとなり、価格が上がっていく可能性が高いこと。また、年間保守料もかかりますし、ベンダーロックインされてしまうと他への移行も難しくなります。それらがオープンソースのKVMを選んだ大きな要因です」と話しました。

また同社はオープンソース事業においてKVMを扱っているために社内に知見があることもKVMを選択した理由として挙げられました。

Linux OSとしては同社が開発し提供しているMIRACLE LINUXを採用しています。

そして前述の通り、クラスタリングソフトウェアとして採用されたのがCLUSTERPRO Xです。

fig

CLUSTERPRO XはWindowsとLinuxの両方に対応し、物理サーバーから仮想サーバー、AWSやMicrosoft Azureなどのパブリッククラウド環境、異なるデータセンター間やクラウド間でも利用可能なマルチクラウド環境、遠隔地間でのディザスタリカバリなど、さまざまな環境に幅広く対応します。

検出可能な障害はサーバの突発的なダウンからOSのスローダウンや部分的障害、アプリケーションやサービスの停止、ハングアップ、NICなどLANの異常、CLUSTERPRO X自体の異常など多岐にわたり、OSやミドルウェア、アプリケーションなどのさまざまな障害に対応して可用性を向上させます。

災害時に運用チームが現場にたどりつけないことも考慮

杉山氏は、BCP(Business Continuity Plan:事業継続計画。緊急時の総合的な復旧対策)の観点において、単純なDR(Disaster Recovery:一時的なシステム復旧対策)だけでなく、包括的なサービス復旧が重要と説明します。

「例えば東京で大災害が発生したら、別拠点へシステムを引き継ぐだけでなく、顧客向けに公開しているURL(DNS情報)を東京から別拠点へ書き換える必要があります。単純にシステムをフェイルオーバーしただけでは、お客様がそのシステムにたどり着けません。

つまりBCPを実現するためには、平時にシステムの監視を適切に行い、「大災害」を定義し、その状況になったらどのようにサービス継続させるかという仕組みを作っておく必要があります。これを分かりやすく細かく設定できて、構成全体が内部で連係・完結するものがCLUSTERPRO Xだけでした」(杉山氏)

しかも大災害が発生しているということは、すなわち東京に一定規模の災害が起きている可能性が高いことを考えると、十分な体制を持った運用チームが現場にたどりつけないことまで考慮しなければならない、と杉山氏は付け加えます。

「その場合、CLUSTERPRO XはNECさんの製品ですから、残された運用スタッフであってもNECさんに問い合わせることで運用を続けていくことができるだろう、ということまで想定しています。

今回構築した高可用性システムは、さまざまな製品を組み合わせて実現することもできます。しかし万が一なにか不測の問題が発生したときに、いくつもの製品ベンダに問い合わせて原因をさぐる作業は、災害発生時には困難なことでしょう。

その点で、CLUSTERPRO Xだけで構築できるというシンプルな構成は、災害時などの高可用性を考えた場合に大きなメリットだと思います」(杉山氏)

「責任あるサービス提供を継続するためには、このシステムを構築した私たちが障害発生時に現場にたどり着けなかったとしても大丈夫だよね、という状態にしておきたいと考えています」(吉藤氏)

責任あるサービス提供を継続するために

この高可用システムはすでに1年以上問題なく稼働しており、メンテナンスや障害を想定した演習も行っているとしています。

現在はAlmaLinuxにも対応した最新のCLUSTERPRO Xへの移行を実施中であり、その上で今後はカオスエンジニアリングのような、本番環境において災害を想定した擬似的な環境を日常的に起こすことで、ふだんから災害に備えるような仕組みを持ちたいと話します。

CLUSTERPRO Xによる高可用性システムと、不断の運用体制の向上によって、そうした運用体制の完成度はさらに高まっていくことでしょう。

高可用性クラスタリングソフトウェア「MIRACLE CLUSTERPRO X」 の最新版を提供開始
CLUSTERPRO概要: 高可用性クラスタリング CLUSTERPRO | NEC

(本記事はサイバートラスト提供によるタイアップ記事です)

COMMENTS


Recommended

TITLE
CATEGORY
DATE
[速報]マイクロソフト、開発環境をまるごとクラウドPCとして用意できる「Dev Box」を発表。Microsoft Build 2022
Microsoft
2022-05-25 15:58
三菱重工と日本IBM、CO2流通を可視化するデジタル基盤を構築へ
IT関連
2021-05-10 07:55
電気設備工事での電力計確認を効率化、SPIDERPLUSときんでんがOCR連携機能実験
ソフトウェア
2021-05-26 18:48
甲州市、LGWAN環境でのクラウドサービス利用にA10 Thunder CFWを採用
IT関連
2024-07-06 16:09
2人乗りの自律型デモ航空機「Maker」をArcher Aviationが公開、商業運航への「足がかり」に
モビリティ
2021-06-13 15:33
契約審査「LegalForce」、自動レビュー機能がプライバシーポリシーに対応
IT関連
2024-02-01 21:26
マイクロセグメンテーションの概念と仕組み
IT関連
2022-05-10 17:44
自社オリジナルで行こう–変革進めるイトーキに聞く、DX人材育成の勘所
IT関連
2023-11-28 04:31
「鬼磁気インナー」、はるやまが発売 ピップとコラボで
くらテク
2021-05-15 02:53
三洋化成工業、構想2年で国内6社のERPを「SAP S/4HANA」に刷新
IT関連
2023-09-01 13:06
SBOM導入の機運高まる、トヨタや日立など多くの企業が取り組む理由とは
IT関連
2024-05-17 18:08
freee、健康診断/ストレスチェックの管理業務を効率化する新サービス
IT関連
2023-09-28 06:14
Twitterが「業界初」機械学習アルゴリズムの「バイアス」を対象とする報奨金コンテスト実施
パブリック / ダイバーシティ
2021-08-03 01:20
NTT Com、ローカル5Gサービスの提供を開始
IT関連
2021-03-31 04:18