NTTデータ、全銀ネットの障害対応を説明–根本原因にめども「包括的な点検が必要」
今回は「NTTデータ、全銀ネットの障害対応を説明–根本原因にめども「包括的な点検が必要」」についてご紹介します。
関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
NTTデータグループは11月6日、全国銀行資金決済ネットワーク(全銀ネット)の「全国銀行データ通信システム」(全銀システム)で10月10~11日に発生した障害に関して記者会見を行い、NTTデータを交えた「システム総点検タスクフォース」を立ち上げると発表した。全銀ネットでの障害に加え、NTTデータが扱う金融決済など100~200の重要システムの品質を包括的に点検するとしている。
全銀ネットでは、障害発生直前の10月7~9日に、全銀システムと金融機関の接続を中継するリレーコンピューター(RC)の更改作業を行った。NTTデータは全銀システムに携わっており、旧RC(RC17シリーズ)を新RC(RC23シリーズ)に更改するプロジェクトを担当している。更改は、金融機関で設置、稼働するRC17シリーズをRC23シリーズに更新した上で、稼働環境を全銀システムに集約するものとなる。
全銀ネットの10月18日の発表によると、障害はRCで処理する金融機関の送金/着金の手数料に関連した「内国為替制度運営費」で発生した。ここでの処理方法の1つに「あらかじめRCに設定されたテーブルを参照してRCが電文に金額を入力」があり、その処理にエラーが発生してRCが異常終了し、電文の送受信に影響が生じた。
NTTデータの説明によると、障害の直接的な原因は、上記の「あらかじめRCに設定されたテーブル」を生成するアプリケーションが内包したバグの可能性が高いという。全銀システムには1100以上の金融機関が接続され、金融機関ごとに多数の取引パターンがあり、障害が発生した処理だけでも数千パターンが存在するという。処理を瞬時に完了するため、RCには「内国為替制度運営費入力・チェック」アプリケーションがあり、このアプリアプリケーションがRCのメモリー上に展開されているインデックステーブルを参照する仕組みとなっている。
障害では、このインデックステーブルを生成するアプリケーションのバグの影響によって、正しいデータを欠損した状態の不完全なインデックステーブルが生成され、RCのメモリーに展開されてしまい、内国為替制度運営費入力・チェックアプリケーションが不完全なインデックステーブルのデータを参照して正しい処理を実行できず、RCの異常停止に至った。このアプリケーションは、従来のRC17シリーズでは問題なく正常に稼働しており、インデックステーブルのデータを正常に生成できないなどの不具合は起きていなかったという。
今回のRC23シリーズへの更改では、OSが32ビットから64ビットに変更されるのに伴い、このアプリケーションも64ビットへの対応改修が行われたという。NTTデータでは事前に入念な検証とテストを実施したといい、全銀ネット側でも本番環境に近い状態で検証とテストを実施していたが、結果として今回の問題が発見されないまま本番稼働を開始し、RC17シリーズの環境では発生しなかった問題がRC23シリーズの環境では発生し、障害に至った。
なお、初期の一部報道で「RCのメモリー容量が不足してインデックステーブルのデータを適切に展開できず不具合が発生」と伝えられたが、NTTデータ側は「いわゆるPCなどのメモリー不足といった状態が発生したわけではない」(取締役副社長執行役員の鈴木正範氏)と否定した。
NTTデータグループ 代表取締役社長の本間洋氏は、記者会見の冒頭で関係各所への謝罪を表明し、同社の調査で判明した事項などを全銀ネット側に報告しつつ、全銀ネットと連携して詳しい検証と再発防止に向けた取り組みついて現在検討を進めていると説明した。
NTTデータでは、障害発生の根本的な原因をインデックステーブルを生成するアプリケーションのバグの可能性としているが、全銀ネットと共同確認中で断定ではないとした。また本間氏は、アプリケーションのバグがどの過程でどのように作り込まれてしまったのかといった局所的な対応だけではなく、各種検査やテスト、本番環境の移行、運用時のバックアップまでを含む全てのプロセスで詳細な再点検と問題点の洗い出し、改善方法の検討、実施までを行う必要があると述べた。
今後これを行うシステム総点検タスクフォースは、本間氏の直轄としてNTTデータグループの品質保証部、技術革新統括本部、NTTデータの全銀システム担当および重要システム(公共・金融・法人)担当の約600人の体制になる見通しだという。今回の障害については全銀ネットと連携し、同社が担う決済や勘定系、中央府省向けなどのその他重要システムについては2023年度末までに総点検を完了させるとした。
本間氏は、NTTデータグループでは以前から厳しい品質基準を設けて開発製品の品質を担保してきたとしつつ、総点検タスクフォースの活動を通じた基準の在り方などについては今後検討していくとした。また、インデックステーブルを生成するアプリケーションのバグという根本的な原因を捉えつつも、「現在はアプリケーション自体にあまり手を入れることなくいろいろな基盤(OS)に持って行くということが増えている。基盤や方法に詳しい技術者も育成しなければいけないだろう」とも述べた。
現在、障害が起きたシステムでは、RCが内国為替制度運営費の入力欄に一律「0円」を入力するようにしてエラーを発生させない暫定措置で運用されている。この状態をいつまで継続するのか、今回の障害に関する再発防止策の詳細、今後のNTTデータグループの取り組みなどについては、全銀ネットとの連携の進展具合などを踏まえて、改めて公表などを検討していくとしている。