メインフレームの信頼性

メインフレームの信頼性について最近疑問に思っている。
東証ダウン、真の原因はプログラムの破損 によると、

売買システムが起動しなかった直接の原因は、取引所に参加している証券会社とその端末コードを登録した「会員情報テーブル」と呼ぶデータを読み込めなかったこと。1日午後に開かれた東証の会見を受けた新聞など各メディアは一斉に、「10月8日から10日の3連休にシステム増強作業を実施した。その後、毎月末に実施しているディスク上のデータ記録位置を整理する処理により、会員情報データの格納場所が移動し、読み込めなかった」と報じた。

ということ、および

しかし本誌の取材によれば、データの記録位置の変更が問題ではなく、データを読み込むための処理プログラムが壊れていたことが、そもそもの原因だった。東証の売買システムはCOBOLで記述されており、富士通メインフレーム上で稼働する。そのCOBOLプログラムを構成するサブモジュール間の「呼び出し関係」が、10月31日夜に行われた月次処理の際、何らかの理由で破損したと見られる。

との話しで、取材の次期により、原因が変わってしまっている。これは、原因の切り分けが短時間でできなかったように見える(主観)。
オープンシステムのデメリットで原因の切り分けがやりにくいという物があるが、メインフレームでも、こんなレベルなんだなぁとガッカリ来た。それとも今回のメインフレームは某F社製だが、そこに原因を特定できる技術者が少ないのかもしれないとも思った。

最近思っているのだが、各社のメインフレームがOSをLinuxに変えていっているが、これについても僕は、信頼性の面で怪しく見ている。
さきほどの記事に

3連休中のシステム増強作業に関して、東証は合計で4回のテストを実施しており、「問題は発見できなかった」とする。しかし、コンデンス処理を想定したテストは実施していない。「コンデンス処理などの月末処理は、富士通がOSと共に提供する標準ツールを使っており、それらが業務アプリケーションにまで影響を及ぼすとは誰も想定していなかった」(東証関係者)のが理由だ。

とあった。これを読んで標準ツールもメインフレームの歴史から見れば、あらたに作り直した物だったりする可能性が有るなぁ〜と思った。(あくまで可能性)

いまは、世界中で動いているシステム数の大半は、ホストのようなクローズドなシステムから、オープンなシステムになってきていると思う。弥生会計とか小規模なソフトウェアを運用している会社など星の数ほど有るだろう。そういった数多の会社が運用して困らない、枯れたシステムがいいのかもしれない。
マシンをリセットして再立ち上げするのも立派な運用だと思う。
言いたいことは、

今はメインフレームだからといって、ソフトウェアの品質やハードウェアの品質が高いとは言えない。

ということ。延々、長いんだよ!!、俺