Live Caption
Googleは10月16日(現地時間)、ライブキャプション機能が、Pixel 4で利用可能になると発表しました。

ライブキャプションは、5月のGoogle I/Oで発表されたもの。スマートフォン上の通話・ビデオ通話を除くあらゆる音声をテキスト化し、字幕のように表示できる機能です。聴覚に障害がある人はもちろん、音を出せない場面や、周囲がうるさくて聞き取れないようなシーンでも活躍しそうな機能です。


最初にPixel 4で利用可能となりますが、年内にはPixel 3と3aにも提供されるとのこと。また、Androidデバイスメーカーと協力しており、来年にはより多くのデバイスで利用可能になるとしています。

ただしサポートしている言語は、いまのところ英語のみ。近い将来、他の言語もサポートするとしています。なお仕組みとしてはネットワークを必要とせず、処理を端末内で完結するシステムとのこと。技術的にはPixel 4の新機能として発表されているボイスレコーダーと同じものと考えられます。


ライブキャプションは、ボリューム操作時に表示されるボタンからワンタップで起動可能。キャプションの場所はドラッグし、自由に配置が可能です。

なお、キャプションの精度は音声の品質にも依存するため、不正確な場合もありますが、今後も技術を改善し続けるとしています。




この手の機能は日本語対応が遅れがちではありますが、Googleはすでに「音声文字変換」として、音声を日本語を含めたテキスト化可能な機能を提供しています。このため、それほど遅くならずに多言語化が進むのではと、期待したいところです。