KDDIが障害についての説明会を実施! |
KDDIは16日、昨年12月31日および1月2日に続けて起こしたau向けデータ通信における障害や1月1日に起こしたau IDの認証決済システムの障害などについて詳細な説明会を開催した。
説明会は急遽行われたとのことで、一部のメディアやジャーナリストのみに案内されたようで、当ブログメディア「S-MAX(エスマックス)」でも説明会があることを確認し、ライターのせう(井上翔)氏にアサインを行った。
説明会の内容や、それによる現在のスマートフォン(スマホ)やタブレットを中心としたクラウドベースのサービス時代におけるデータ通信のありようについては、後日、参加したせう氏によるコラムで伝える予定である。
そこで、今回は、せう氏がTwitter上でつぶやいた内容をベースに簡単に説明会の内容を紹介していく。
まず、KDDIでは、2012年12月31日と2013年1月2日に起こったデータ通信障害について説明。なお、1月2日の障害については、発生時間を0時17分からに訂正している。
■2012年12月31日(月)における障害の概要
■2013年1月2日(水)における障害の概要
その上で、auのデータ通信では、信号制御装置のタイムアウト時間の短縮と、加入者プロファイルサーバーが応答しないときに信号制御装置が代理応答するように改善したことを紹介。
これらの改善において、障害原因が装置アラームの誤発砲と復旧時の手順書の不備であったと説明した。
具体的には、呼処理ログコピーの遅延を誤って装置全体の不具合とみなしてアラームが鳴ってしまったという。これについては、今月30日までに修正完了予定だとのことだ。
さらに、復旧も、本来はカード系切り替えで良いものを全体リセットからLTE端末すべてのセッション解放という流れになったことで、LTE端末すべてが同時に再接続処理を行ったため輻輳が起こり、さらなる障害時間の長期化につながったとのこと。
続いて、元旦に起こしたau IDの決算不具合についても説明し、データベースサーバー群のメモリーアロケート処理設定の不手際で、サーバー負荷が高まってしまったのが原因だとした。
これについては、11月にデータベースサーバーのハードウェアを増強し、設備そのものは余裕あったものの、ソフトウェア設定の誤りで過剰な負荷となってしまったということだ。
以上のことから、大晦日12月31日の障害は過去にNTTドコモがspモードで起こした原因と類似しているものと推測できる。スマホやタブレットになったことで、1つの端末からの同時接続数が増え、それによってトータルの接続(セッション)数が劇的に増加したことが根本的な原因になると見られる。
なお、ソフトバンクモバイルが大きい障害にならないのは、公平なデータ通信制御(規制)をガチガチにやってるからとも見られ、質疑応答では、この件について、KDDI側ではソフトバンクモバイルと同様に規制をより厳しくするというようなことはしないということを語っていた。
■関連リンク
・エスマックス(S-MAX)
・エスマックス(S-MAX) smaxjp on Twitter
・KDDI、auで一部エリアにおいてパケットデータ通信を利用できない障害が12月31日0時から発生中(4時23復旧済み) - S-MAX - ライブドアブログ
・KDDI、au向け4G LTE対応端末でパケットデータ通信が利用できない障害が0時5分から発生中(1時53分復旧済み) - S-MAX - ライブドアブログ
・Sho INOUE(@shoinoue)/2013年01月16日 - Twilog
・KDDI株式会社――Designing The Future
■2012年12月31日(月)における障害の概要
掲載日 2012年12月31日
日時 2012年12月31日(月) 0時00分~4時23分
対象 4G LTE対応端末にてauパケットデータ通信をご利用のお客様
詳細内容 auパケットデータ通信がご利用できない事象が発生しておりましたが、4時23分に復旧し、すべてのエリアでご利用いただけるようになりました。
対象地域 全国
■2013年1月2日(水)における障害の概要
日時 2013年 1月 2日(水) 00時05分から01時53分
対象 4G LTE対応端末にてauパケットデータ通信をご利用のお客様
詳細内容 4G LTE対応端末にてauパケットデータ通信がご利用できない事象が発生しておりましたが、01時53分に復旧し、すべてのエリアでご利用いただけるようになりました。
対象地域 全国
その上で、auのデータ通信では、信号制御装置のタイムアウト時間の短縮と、加入者プロファイルサーバーが応答しないときに信号制御装置が代理応答するように改善したことを紹介。
これらの改善において、障害原因が装置アラームの誤発砲と復旧時の手順書の不備であったと説明した。
具体的には、呼処理ログコピーの遅延を誤って装置全体の不具合とみなしてアラームが鳴ってしまったという。これについては、今月30日までに修正完了予定だとのことだ。
さらに、復旧も、本来はカード系切り替えで良いものを全体リセットからLTE端末すべてのセッション解放という流れになったことで、LTE端末すべてが同時に再接続処理を行ったため輻輳が起こり、さらなる障害時間の長期化につながったとのこと。
続いて、元旦に起こしたau IDの決算不具合についても説明し、データベースサーバー群のメモリーアロケート処理設定の不手際で、サーバー負荷が高まってしまったのが原因だとした。
これについては、11月にデータベースサーバーのハードウェアを増強し、設備そのものは余裕あったものの、ソフトウェア設定の誤りで過剰な負荷となってしまったということだ。
以上のことから、大晦日12月31日の障害は過去にNTTドコモがspモードで起こした原因と類似しているものと推測できる。スマホやタブレットになったことで、1つの端末からの同時接続数が増え、それによってトータルの接続(セッション)数が劇的に増加したことが根本的な原因になると見られる。
なお、ソフトバンクモバイルが大きい障害にならないのは、公平なデータ通信制御(規制)をガチガチにやってるからとも見られ、質疑応答では、この件について、KDDI側ではソフトバンクモバイルと同様に規制をより厳しくするというようなことはしないということを語っていた。
記事執筆:S-MAX編集部
■関連リンク
・エスマックス(S-MAX)
・エスマックス(S-MAX) smaxjp on Twitter
・KDDI、auで一部エリアにおいてパケットデータ通信を利用できない障害が12月31日0時から発生中(4時23復旧済み) - S-MAX - ライブドアブログ
・KDDI、au向け4G LTE対応端末でパケットデータ通信が利用できない障害が0時5分から発生中(1時53分復旧済み) - S-MAX - ライブドアブログ
・Sho INOUE(@shoinoue)/2013年01月16日 - Twilog
・KDDI株式会社――Designing The Future