みずほ銀行が2021年2月から2022年2月までの12カ月の間に、合計11回起こしたシステム障害。本書「ポストモーテム みずほ銀行システム障害事後検証報告」(日経BP)は、原因や背景を検証し、システムを安定稼働させるための一般的な教訓を導き出そうとしたものである。
「ポストモーテム みずほ銀行システム障害事後検証報告」(日経コンピュータ著)日経BP
著者はIT専門誌「日経コンピュータ」編集部。本書の刊行は同誌にとって一つの「けじめ」だった、と書いている。どういうことなのか。
15の謎、その原因とは?
みずほファイナンシャルグループは2度の大規模システム障害を経て、老朽化した勘定系システムを全面刷新し、新システム「MINORI」を2019年7月に全面稼働させた。
その経緯を、「日経コンピュータ」は2020年2月に書籍「みずほ銀行システム統合、苦闘の19年史」としてまとめた。「MINORI」の開発には4000億円が投じられ、なかなか完成しないことから「IT業界のサクラダ・ファミリア」と揶揄されたそうだ。
「勘定系システムを複数のコンポーネントに分割し、コンポーネント間のつながりを緩やかにすることで、障害の影響を極小化する狙いがあった」と説明していた。だが、実際には、システムを構成するコンポーネントをまたいで、連鎖する障害が発生したのである。
ATM(現金自動預け払い機)が通帳やカードを取り込む事態が発生した2021年2月28日の1回目のシステム障害はよく知られている。ところが、それ以外のシステム障害を含め、行内で何が起きたのかを詳しく追っている。
11回のシステム障害の大半は、よくある小さなシステム障害のままで済んだが、1回目と2021年8月20日の5回目のシステム障害は、金融機関ではあり得ない問題が次々に生じ、深刻なトラブルとなった。
そこには、「なぜデータベースは更新不能になったのか」「なぜそれがATMのカード取り込みにつながったのか」「なぜ警告やエラーは見逃されたのか」など15の謎があるとして、技術的に詳しく解説している。