通信障害の実態と対策状況について考えてみた!

先週は何かと通信関連でニュースの絶えない週でした。8月24日にはKDDI回線において障害が発生し、au、UQ mobile、povo、au回線利用事業者の音声通話、ホームプラス電話、ホーム電話、SMS送受信などが45分間利用しづらい状況が発生したほか、8月25日にはNTT西日本のフレッツ光ネクスト、フレッツ光ライトを契約する、大阪を除く関西や東海・北陸の一部の地域で約6時間にわたって通信しづらい状況が発生していました。

いずれも機器(設備)の故障によるもので、故障設備の切断及び交換、回線の切り替えなどで対応が行われ、8月26日(金)18時時点では完全に復旧しています。

普段何事もなく通信を利用していると、通信できることは当たり前であり通信障害や設備故障など万が一にも起こしてはならないことだろうと極論で語りたくなりがちですが、実際には毎日何十・何百という通信障害や設備故障が発生しているのです。

通信障害が日々当たり前のように発生しているにもかかわらず、私たちユーザーがそれを体感せずに過ごせているのは何故でしょうか。また私たちは通信障害とどのように向き合っていくべきなのでしょうか。

感性の原点からテクノロジーの特異点を俯瞰する連載コラム「Arcaic Singularity」。今回は通信障害の実態と対策について解説します。

as-247-002
通信障害は何故起こるのか


■日々常に発生し続けている通信障害
固定回線やモバイル回線にかかわらず、みなさんが思い浮かべる通信障害(通信故障)とはどのようなものでしょうか。

スマートフォン(スマホ)でネットに繋がらない、通話できない、自宅でNetflixの映画が観られない。そのような具体的な事象が発生して、初めて通信障害を疑うかと思います。

冒頭でも書いたように、普段当たり前のように通信を利用していると、そこに障害が発生するなど言語道断である、といった具合に極論を語りたくなることがあるかもしれませんが、実は毎日・毎時・毎分のように通信障害というものは発生し続けているのです。

as-247-003
通信障害は決して珍しいことではない


例えばNTTドコモの場合、2019年時点での通信故障(通信障害)の発生件数は年間十数万件、さらにサイレント故障と呼ばれるアラートを検知できない故障は年間数万件にも及びます。

合計すれば年間20万件近くにものぼるそれらの故障の多くは表に出てきません。これはNTTドコモが故障や障害を隠蔽しているのではなく、実際にユーザーが不便や不都合を実感してしまうほどの障害に発展する前に、正常な通信経路の確保や故障設備の切断などを行って逐次対策を行っているからです。

as-247-004
機器故障のほとんどはソフトウェア的なもので、機器の再起動や再接続によって復旧される場合も多い


「実際に体感できていないならそれは障害ではないじゃないか」と思われるかもしれません。しかしながら、これらの設備故障などの対応が遅れれば確実に通信障害として顕在化します。その最たる例こそ、KDDIが7月に起こした大規模障害です。

あの事象では通信設備の交換に際して不具合が発生したことが最初の原因でしたが、その後トラフィックの混雑や輻輳を発端とした設備故障に繋がり、その設備故障(DB不整合)を発見できずに放置してしまったことが60時間超に及ぶ空前の大事故へと発展させてしまったのです。

通信障害の基本は「早期発見・早期対応」です。僅かでも発見が遅れれば通信トラフィックが詰まり、あっという間に輻輳が始まるからです。

as-247-005
NTTドコモは2019年度より人が検知できないサイレント故障についてAIによる検知を可能としたシステムを導入している


■止められないデータ通信量の増加
そういった企業の努力や新たなオペレーションシステムの導入にもかかわらず、障害は否応なしに発生しています。背景には昨今の通信量の急増があります。

私たちの生活は通信によって劇的に快適になりましたが、そこで利用されるデータ通信量も膨大に膨れ上がっています。

コロナ禍によるテレワークの増加や自宅でのネット利用の増加が始まる以前からデータ通信量の指数関数的な増大は予測されており、その増加量予測はコロナ禍によって加速していると言っても過言ではありません。

そして現在の通信インフラ環境とその技術をただ延長しただけでは、その増加速度に全く追いついていかないであろうというのが多くの業界関係者(リーディング企業)の共通した見解です。

as-247-006
NTT「IOWN構想」より引用。データ通信量の指数関数的増大は止めることができない


そのため、通信の基幹を担う各企業はオールフォトニクス・ネットワークや超分散コンピューティングなどによって各所の負荷やボトルネックを解消させつつ、通信全体としての効率的な運用環境の構築を目指していますが、このような超多端末・超高密度な通信環境になればなるほど、人力による通信故障の早期発見は難しくなります。

だからこそNTTドコモなどは、AIを用いた検知システムの構築や、ゼロタッチオペレーション(ZTO)と呼ばれる「人の手を介さない通信装置の自動監視・自動復旧システム」の導入および確立化を急いでいるのです。

as-247-007
物理的な故障以外の多くの状況で、AIによる遠隔操作での復旧が可能になった


■平時より通信障害が起こった場合に備えておこう
通信トラフィックの逼迫とそれに起因する通信障害は、もはや他人事でも対岸の火事でもありません。

最近では大手オンラインゲームのプロデューサーがユーザーに向けた公式放送の場で「特定の会社名(ISP=インターネットサービスプロバイダ)は言わないが設備投資をしてくれないと困る。(通信が不安定で)ゲームにならない」と苦言を呈するといった場面すら見かけたことがあります。

ストリーミング映画配信の普及や動画投稿サイトのリッチ化(高画質化)、SNSでの動画投稿の一般化など、ゲーム以外にも通信容量を圧迫するような事象と時代の流れは山ほどあります。むしろ総合的なデータ通信量の少ないオンラインゲームなどよりも余程通信容量を圧迫するものばかりです。

ISPだけではなく、NTTやKDDIのように基幹通信網を担う企業がどれだけの設備投資を行ったとしても、それを管理するシステムや障害復旧のシステムが確立され、通信量の増大に追従できていなければ、通信における大事故は間違いなく再び起こります。

as-247-008
常時通信を必要とするオンラインゲームで起きている問題は、今後メタバースなどでも同様に問題化していくだろう


通信社会の高度化とは、つまり通信障害に対して脆弱な社会であるという裏返しでもあります。実際、7月にKDDIが起こした大規模障害では、交通システムや電子マネーなどで多くの機能不全を引き起こしました。

今後こういった大規模な事故が発生しないとは全く言えません。むしろ必ず発生すると言い切っても良いでしょう。それは偶発的な事故だけではなく、天災や時には人災によるものかもしれません。

このような通信障害に対して私たちにできることと言えば、通信障害が常に発生し得るものだという認識を持つことと、万が一の事態に備えることです。

例えば複数の通信回線を契約しておくことであったり、現金を多少でも常に持ち歩くなど、非常に手軽で些細な事です。

通信が途絶えるということは、その時点から先の情報が圧倒的に得られなくなるということでもあります。だからこそ事前準備や事前の知識が重要なのです。

何の準備も心構えもなく事態に遭遇し、何もできずに困惑するだけの状況に陥ることだけは避けたいものです。

as-247-009
9月1日は防災の日。通信の防災も考えてみよう


記事執筆:秋吉 健


■関連リンク
エスマックス(S-MAX)
エスマックス(S-MAX) smaxjp on Twitter
S-MAX - Facebookページ
連載「秋吉 健のArcaic Singularity」記事一覧 - S-MAX