NTTドコモの輻輳障害について考えてみた!

既報通り、NTTドコモの携帯電話サービスにおける音声通話およびデータ通信にて利用しづらい事象が全国規模で10月14日17時頃より発生し、事象の原因となった位置登録不可の影響範囲は推定で約200万ユーザーだと発表されました。

その後、音声通話およびデータ通信にて利用しづらい状況は翌10月15日5時5分に5G/4Gネットワークでは回復し、さらに復旧が遅れていた3Gネットワークでも10月15日22時00分にすべて回復したということです。

今回起きた事象は通信ネットワークの「輻輳」と呼ばれるもので、通信量過多による混雑に起因するものです。そしてその混雑が発生した理由は、IoT機器向けの設備を新しい設備へと変更する際に不具合が生じ、再び古い機器へと切り戻す(元に戻す)ための作業を行う段階で発生したものでした。

原因や発端はどうであれ、こういったネットワーク障害による通信不能は私たちの生活に大きく影響するようになりました。その影響力はわずか5年前と比較しても相当に多大なものとなっています。私たちの生活はどこまで通信ネットワークに依存し、通信ネットワークなしでは生きていけない生活となっているのでしょうか。

感性の原点からテクノロジーの特異点を俯瞰する連載コラム「Arcaic Singularity」。今回はNTTドコモの輻輳障害から、私たちの生活と通信ネットワークの関係について掘り下げていきます。

as-202-002
私たちの生活はどこまで通信と関わっているだろうか


■設備の切り替え作業の見積もりの甘さが引き起こした事故
はじめにNTTドコモが起こした輻輳障害について簡単に時系列でおさらいしておきます。詳細はこちらの記事を御覧ください

障害の発端となったのは主にIoT機器向けの通信設備(位置情報サーバー)の交換作業でした。この設備をさらに性能の高い新しい設備へと交換し、5G時代に爆発的に増加することが予想されるIoT機器の受け入れ体制を整えることが目的でした。

NTTドコモはこの交換を14日0時より開始していましたが、7時26分の段階で不具合を確認。万が一の不具合に備えていた手順通りに古い設備への切り戻し作業を開始します。

ちなみに、この時の「新しい設備で発生した不具合」とは、位置情報の登録に関するものでした。通信機器はIoT機器に限らず、その位置情報を登録することで「これはNTTドコモのネットワークを利用する機器です」といったような確認を行っています。

私たちが利用するスマートフォン(スマホ)も通信の際にはこういった位置情報の確認を行うことで、スムーズで繋がりやすい通信環境を確保しています。

新しい設備へ位置情報を登録する際、日本国内のIoT機器では問題がなかったものの、海外のIoT機器で登録情報に問題が発生し、そのままでは古い設備からの移管作業が行えなかったということです。

そのため、NTTドコモでは古い設備へと戻す作業を行うことになりました。

as-202-003
私たちが何気なく利用している通信ネットワークは、さまざまな端末情報の管理によって成立している


ところが、その古い設備への切り戻し作業でさらなる問題が発生してしまいます。新しい設備へ位置情報を移し終えたIoT機器は、再び古い設備へ情報を戻さなければいけませんが、その戻す段階で輻輳を起こしてしまったのです。

通信ネットワークの輻輳とは、分かりやすく言えば大渋滞です。一気に大量の通信が発生したことで処理しきれなくなり、通信が止まったのです。

NTTドコモももちろんそういった状況が起こり得ることを想定し、切り戻す機器の数を20万台ずつに制御して行っていたそうですが、その台数の見積もりが甘かったことが今回の問題の最大の原因となってしまいました。

例えば、道路で交通事故が発生すれば、そこを起点にあちこちからの車両が殺到してさらなる大渋滞を引き起こしますが、通信ネットワークでも同じような状況が起こります。

全国の20万台のIoT機器が一斉に位置情報登録のための通信を行おうとして輻輳が発生し、通信が遅延したり止まってしまったことで、それぞれのIoT機器は位置情報を登録するためにさらに再送信を繰り返します。

つまり、ネットワーク攻撃でよくあるDDoS攻撃のような状況が生み出されてしまい、輻輳状態がますます悪化する悪循環が発生しました。対象となる機器の多くが自動運用されるIoT機器であったことも、制御を失わせた原因かも知れません。

こうしたIoT機器を管理する設備の輻輳はやがて通信トラフィック全体も逼迫し、一般の利用者も繋がりにくくなる輻輳状態となってしまったことからNTTドコモでは17時37分より全国規模での通信停止を伴うネットワークコントロール(通信規制)が行われるに至ります。

as-202-004
不具合に不具合が積み重なった結果が今回の事故だった


問題を大きくしてしまった一端としては、IoT機器の通信トラフィックと一般の利用者の通信トラフィックを別々で管理できていなかったことが挙げられます。

現在の最新の技術ではこういったものは1つのサーバー内で仮想化され、論理的に別々の管理が行えるようになっていますが、古い設備ではそれが行えないままでした。

つまり、輻輳などに耐性の高い仮想化技術(スライシング技術)を導入した新しい設備へ入れ替える作業で、仮想化技術を導入していない古い設備の弱点が露呈したということになります。

この通信サーバーの仮想化技術こそが、5G時代に併せて進められてきた新しい技術なのです。

as-202-005
ワイヤレスジャパン2018でKDDIが展示していた仮想化基地局のスライシング技術


■通信が必須の時代だからこそ通信を過信してはいけない
問題の原因や状況は把握できたとして、それでは私たちの生活ではどのような影響があったのでしょうか。

最もシンプルに考えるならば、

・通話ができない
・Webサイトが閲覧できない
・SNSが使えない

こういったものだと思います。しかしながら、影響はそれだけでは済みません。さらには、

・QRコード決済ができない
・オンラインサービスが利用できない
・通信を必須とする各種スマホアプリが利用できない
・2段階認証のパスコードが送信されない

といったような問題も起こりました。

例えば、2段階認証が利用できないことは自宅の光回線などを利用している場合でも大きな問題となります。

自宅のパソコン(PC)などからオンラインショッピングやオンラインサービスを利用しようとした際、2段階認証のパスコードや認証自体をスマホで行うものがありますが、こうした場合に通信が止まっていれば、認証を通せなくなりサービスが利用できません。

セキュリティーのために複数の機器と複数の通信回線を利用して認証を行っていることが仇となり、障害が起こっていない回線でもサービスを利用できないという事態が起こり得るのです。

もちろん、自宅回線から無線LAN(Wi-Fi)接続などを行える環境を整えていれば回避できることもありますが、Wi-Fi環境がなかったり、そもそも4Gなどのモバイルネットワーク経由でなければ認証を通さない(通信設備による端末認証が必須)といったシステムもあります。

as-202-006
2段階認証はそのシステムが複雑だからこそ高いセキュリティを誇るが、それゆえに通信ネットワーク障害が起こると影響範囲も大きくなる


今どき現金を持ち歩くなんて時代遅れ、などと言われるようになって久しい昨今ですが、やはりデジタルのみに頼ったり、1つのネットワークシステムに依存するのは少々リスクがあります。

・モバイルSuiCaアプリにチャージができずホームから出られない
・レストランでQRコード決済ができずに退店できない
・カーシェアサービスで料金が支払えずクルマを返せない

そんな状況は容易に想像ができます。もちろん、サービスを提供するお店や企業側としても多大な問題が発生します。

今回は完全に通信不能となった時間が1時間半ほどだったことや、一部とは言え、20時台には通信の回復が図られたことで想像を超えるような大混乱は避けられました。

しかしながら、それでも今回のような謝罪会見を開く事態となるほどであったことを考慮すれば、もしもこれが一昼夜通信途絶状態だったらと想像するだけでも恐ろしくなります。

as-202-007
電話もできず、SNSも使えない状況で人々が取れる行動は非常に少ない


こういった輻輳障害を回避するために行っていた設備の切り替え作業で輻輳障害が起きるという、なんとも皮肉な事故が今回の顛末です。

NTTドコモは問題の再発防止策として10月下旬を目処に新旧設備の処理能力を再確認した上で適切な切り替え手順への見直しを行っていくとし、設備の入れ替え作業自体もその後適切な時期を見計らって行うとしています。

技術とは常に進化しその進化したものへと乗り換えていく必要があります。それは単に「今よりも便利にする」ためだけではなく、セキュリティーを高めたり冗長性を向上させて障害への耐性を高めるためでもあります。

私たちの生活が通信ネットワークに深く依存している時代だからこそ、その技術の更新と進化は止めるわけにはいきません。その技術の切り替えで起きた今回の事故は、そういった通信に依存する私たちへの警鐘と気付きを促すものであったようにも感じます。

通信料金も下がり、中にはKDDIの「povo2.0」や楽天モバイルの「Rakuten UN-LIMIT VI」のように月額0円から始められる料金プランも存在する今、1つの通信ネットワークに頼るのではなく、複数の通信契約を併用したり、現金などの代替手段を用意しておくようにはしたいものです。

as-202-008
通信サービスは万能と過信せず、必ず予備の手段を用意しておきたい


povo




記事執筆:秋吉 健


■関連リンク
エスマックス(S-MAX)
エスマックス(S-MAX) smaxjp on Twitter
S-MAX - Facebookページ
連載「秋吉 健のArcaic Singularity」記事一覧 - S-MAX