DNP
大日本印刷

大日本印刷株式会社(DNP)とDNPコミュニケーションデザイン(DCD)が6月15日、読み間違いを減らし、人が読むイントネーションやアクセントに近い自然な音声を自動生成できる音声合成システムを開発したと発表しました。

現在も様々なシーンで利用されている音声合成システムですが、漢字の誤読やイントネーションが不自然になるなど、まだいくつかの問題を抱えています。多少の読み間違えなどは問題にならないこともありますが、学習教材や行政文書などでは、正確な情報が求められます。

あらたに開発された音声合成システムは、従来のシステムと比較し、漢字の誤読や、「橋」「箸」「端」など同じ読みながら異なるイントネーションに関して読み間違いを約50~70%削減したとしています。

これを実現するため、DCDが保有する読み間違いのない音声データをAIに学習させたほか、追加学習により、さらに正確性を増せるとのこと。複数の生命保険会社の約款で検証したところ、読みやアクセント、文章の間について約85%以上の正確性が確認されたとしています。

なお、下記の動画のナレーションもDNPの音声合成が利用されているとのことです。

DNPではこのシステムについて「情報を正しく伝えることが重要であり、テキスト量の多いコンテンツ」で高い効果を発揮すると説明しており、学校教材や行政文書、金融機関や保険などの約款・契約書、製品マニュアルなどでの活用が期待されます。

人間に近い、自然な抑揚で読み上げられるようになるなら、今後、オーディオブックなどでも広く活用できるかもしれません。

Source: DNP