未来のSiriはヒトの顔色をうかがう? アップルが特許申請

音声アシスタントが人間に忖度する未来がもうすぐ

Kiyoshi Tane
Kiyoshi Tane
2019年11月16日, 午前 06:00 in apple
0シェア
FacebookTwitter
Apple ShowcaseASSOCIATED PRESS

音声アシスタントは年々聞き取り精度が向上し、人間ユーザーの音声コマンドに対して適切に答える「正答率」も高まっています。とはいえ、今なお聞き間違えも多く、微妙なニュアンスを読み取るには至っていません。

アップルがそうした状況を改善するため、ソフトウェアが人の感情を読み取って対応に役立てるという内容の特許を出願したことが明らかとなりました。この特許技術の開発が進めば、将来的にはSiriに顔分析機能が追加され、ユーザーの気分に応じて反応を変えるようになる可能性があります。米特許商標庁(USPTO)が14日公開したアップルの申請特許は「インテリジェントソフトウェアエージェント」というもの。その概要は「顔の表情や感情に応じてインテリジェントエージェントの動作を変更する」とされています。

ここでいう「インテリジェントソフトウェアエージェント」とは、「ユーザーに代わってアクションを実行できる」「ユーザーが話した文など、自然言語のユーザー入力に応じてアクションを実行できる」と定義され、Siriなど音声アシスタント一般を含むと思われます。

本特許の主な目的は、「状況によっては、エージェントが実行したアクションがユーザーのアクションと一致しない場合がある」事態を解消することです。

このシステムは「マイクやオーディオ入力を取得し、カメラで1つ以上の画像を取得する」ことで機能するもの。iPhone X以降のモデルでは、顔認証のFace IDのほか、顔の表情を読み取ってアニ文字に反映するTrueDepthカメラもあり、ハードウェアの要件は満たしていると推測されます。

さて、特許文書で挙げられたアプローチの一例は「ビデオ入力の顔画像を分析して、形状や動きを識別することで特定の筋肉や筋肉の部位が活性化されているかどうかを判定する」というもの。その目的の1つは、ユーザーの感情的な状態を読み取ることだと述べられています。ユーザーの反応情報(表情)は、どのぐらい肯定的か、どのぐらい否定的かといった特定の状態に対応した確率に換算されるとのことです。
Siri
これは音声コマンドが様々な解釈ができる状況で、ユーザーの真意を絞り込むために役立ちます。Siriは顔認識を通じてユーザーが満足しているかイライラしているかを読み取り、それに基づいて最も可能性が高い意味を判断できるわけです。

同じ言葉を発していたとしても、笑っているか怒り顔かで意味がまるで異なるのは、人間関係でもよくあることです。特許を申請ないし取得したからといって実際に製品に反映されるとは限りませんが、将来のSiriはユーザーの顔色をうかがい、気づかいあるいは忖度してくれるのかもしれません。
 
 

TechCrunch 注目記事新型コロナのソーシャルディスタンスを支援するビデオチャットアプリ8選

新型コロナウイルス 関連アップデート[TechCrunch]
関連キーワード: ai, apple, faceid, patent, siri, truedepth, voiceassistant
0シェア
FacebookTwitter