Woman In Kitchen Asking Digital Assistant Question
Getty Images/iStockphoto

カーネギーメロン大が「OK Google」や「Alexa」などのウェイクワードを使わずに、スマートスピーカーが自身に話しかけられていることを認識できる技術を開発しました。

スマートスピーカーなどに搭載される音声アシスタントは、便利な反面、都度ウェイクワードを発しなければならないのが面倒でもあります。

このため、GoogleはNest Hubの超音波センサーを使ってウェイクワードなしに操作できる方法をテストしているとも伝えられていますが、これはセンサーがなければ使えず、かつデバイスの近くにいる必要があります。

この不便を解消する方法として、カーネギーメロン大の研究者は、音の方向に着目。音声の周波数成分により、スマートスピーカーに直接向けられた音声なのか、壁などに反響して届いた音声なのかを認識できる機械学習モデルを作成しました。

これを使うことで、ウェイクワードは不要で、スマートスピーカー自身が自分に向けられた指示なのかどうかを判断できるようになります。この方法は軽量なソフトウェアベースで実現でき、都度クラウド上で音声を解析しなくてもデバイス単体で利用出来るとのことです。

現状では、90%の精度で認識に成功するとのことですが、使用上の問題点もあります。指示は常にデバイスに向けて発する必要があるので、何かの作業中についでに指示するような使い方はできません。これはスマートスピーカーの使い方としては、やや不自然な印象です。また、現在は複数人がいるような状況(レストランやパーティーなど)でも使用できず、ノイズが多い環境での堅牢性が課題だとしています。

なお、この技術はスマートスピーカーをウェイクワードなしで利用するためだけのものではなく、たとえば補聴器に搭載できれば、装着者に向けられた音声だけを選択的に増幅するといったことが可能になります。

なんにしろ、すぐに実用化出来るようものではありませんが、近い将来、「OK Google」で部屋中のスマートスピーカーやスマートフォンが反応してしまうことは、なくなるのかもしれません。

source: Karan Ahuja