AIが映像と音声を解析して字幕作成、大日本印刷ら開発

字幕放送での実用化を目指す

金子 麟太郎(Rintaro Kaneko)
金子 麟太郎(Rintaro Kaneko)
2020年08月24日, 午前 11:05 in nhk
0シェア
FacebookTwitter
20200824 dnp jimaku ai

大日本印刷株式会社(以下DNP)とNHKテクノロジーズは、映像と音声をAI(人工知能)で解析し、内容や感情にふさわしい字幕を表示する「感情表現字幕システム」のプロトタイプを共同開発しました。字幕放送(オープンキャプション)での実用化を目指します。

感情表現字幕システムの具体的な仕組みは、録画やライブ(生放送)の音声を解析して、リアルタイムで字幕を自動付与するというもの。その際、字幕の内容や発話者の表情を解析して感情を把握し、その感情の表現に最適なフォントを12種類のなかから自動選定して字幕に使用します。例えば、楽しい内容は丸みのあるフォントで、怒っている内容は角ばったフォントで表示することで、より直感的に内容を伝えることが可能だと言います。

さらに、映像内の発話者を特定して、自動的にその口元の近くに字幕を表示する仕組みも取り入れており、複数人いても誰が何について話しているか理解しやすいとしています。

制作側の負担を減らすのが狙い

両社によると、近年、多くの人にわかりやすく情報を伝える“ユニバーサルメディア”へのニーズが高まっており、テレビ番組の放送においても聴覚に障がいのある人や高齢者などに向けた字幕付与が求められています。その一方で、番組制作側にとって字幕付与の作業が大きな負荷になっており、自動的に精度の高い字幕を付与できる技術が求められています。感情表現字幕システムは、こうした需要に対応するものです。

なお、感情表現字幕システムは、2018年にDNPが開発した文章の内容に合うフォントを自動判別して表示する「DNP感情表現フォントシステム」を活用しています。

両社は、今後、音声認識や感情認識のAIの精度を向上させるほか、リアルタイム性の向上も進め、生放送やインターネット同時配信サービスの字幕(クローズドキャプション)への展開も目指します。さらにDNPは、デジタルサイネージ等の動画の字幕に応用するほか、誰でも利用できる映像編集用ソフトウェアとして提供していく計画です。


source:大日本印刷 , NHKテクノロジーズ


 
新型コロナウイルス 関連アップデート[TechCrunch]

 

関連キーワード: nhk, dnp, ai, movies, text, news, gear
0シェア
FacebookTwitter