engadget

NTTドコモは10月15日、昨日発生した通信障害について緊急会見を実施しました。

engadget

同社によると、障害発生の経緯は次のとおりです。

まず、10月14日(木)の未明にかけて、IoTサービス向けの「加入者/位置情報サーバー」を旧設備から新設備への切り替える工事を実施していました。

この切り替え後、新設備において不具合が発生。この復旧のため、旧設備への切り戻しを実施した際に、約20万台のIoT端末から大量の位置登録信号が旧設備に殺到。これによって輻輳が発生し。それがドコモ側のネットワークに波及し、音声通話およびパケットサービスで通信しづらい状況に陥りました。

これを受け、同社は全国すべての位置登録信号に対するネットワークコントロールを実施。これを19時57分に緩和し、10月15日5時5分に5G / LTEサービスが回復しました。

engadget

今回の障害を受けて、NTTドコモは大規模工事の手順を見直します。具体的には、システムの通常運用と異なる状態での処理能力を再確認するほか、確認した処理能力を踏まえた適切な切り換え手順への見直しを実施するとしています。完了は10月下旬を予定します。

下記質疑応答抜粋

──どの程度のネットワークコントロールを実施したのか

(IoT端末からの位置登録信号殺到に起因する)ネットワーク保護のため、17時37分から一時100%のネットワークコントロールを実施した。このネットワークコントロールは19時57分に緩和を完了した。

──なぜここまで長期化?

昨日、19時57分にネットワークコントロールを緩和し、一部復旧報を出した。その後お客様の利用が増えて、輻輳が発生し、一部のお客様で繋がりにくい状況が発生した。繋がりにくい状況でお客様が何回も接続しようとしたため、トラフィックが通常より3倍ほど増えたのが、長引いた理由。

──19時57分の復旧報がアクセス殺到の原因となり、障害のさらなる長期化を招いたのか

結論から言うと、復旧報によるトラフィックの増大よりも、IoT端末による影響のほうが大きかった。19時57分に全てのネットワークコントロールを緩和したため、アンテナピクト表示が変わり、トラフィックが急増したが、これよりもIoT端末による影響のほうが大きかった。

──『19時57分に完全復旧』という報道もあったが

プレスリリースの中では『完全復旧』という表現は使っていないが、今後のプレスのあり方については見直したい。

──どのくらいのユーザーの影響した?

具体的なユーザー数は算出できていない。しかし、昨日から今日の未明にかけて、対前週比で音声通話の回数は全国で15%くらい減った。また、パケット通信量は4%減少した。

──長期化させない方法はなかったのか

(新設備から旧設備への切り戻しの際に)IoT端末を小分けにして制御し、旧設備を切り換えていくことをやった。切り換えていく中で、旧設備の処理能力を考えて、安全に設備を切り換えていくことを考えたので、時間がかかってしまった。

──3Gの復旧はなぜ時間がかかっているのか

3Gの障害は昨日の4G / 5Gほどひどくない。3G障害の明確な回復時期はお答えできない。3Gも安全にモジュールの切り換えをやっているので、もうしばらくお待ちいただければと思います。

──MVNOへの影響は

一部影響があったと把握しているが、具体的に何社に影響合ったかはこの場では回答できない。後ほど広報から回答する。

──総務大臣から詳細な報告を求められているが

総務省さんには昨日5時半に第一報を入れた。今後の具体的な話については、影響範囲や法令に則り総務省側が判断すると思うので、ドコモ側としても真摯に対応する。

──緊急通報を出せなかった、商談ができなかった… そうしたユーザーが受けた実害について、どの程度把握しているか

緊急通報については過去の一部機種について利用できない場合があったと認識。アプリで弾かれたとか、そういった情報は持ち合わせていない。

──シェアサイクルやd払いへの影響規模は

シェアサイクルについても位置登録ができなかったために一時利用できなくなった。

──たった20万台のIoT端末からの位置登録信号殺到でネットワークが輻輳するものなのか

20万台というのは、新設備から旧設備に切り替えた最初に20万台。新設備は仮想化しているが、旧設備は仮想化しておらず、処理能力が低い。

──今回失敗した新設備の移行は、今後いつ実施する予定か

10月下旬までに再発防止策を実施。次は100%絶対に成功することを見越さない限りはできない。切り換え手順の作成状況などをみながら、適切な時期に実施する。

更新完了