ビデオ会議で『任意の画像』に喋らせるMacアプリ「xpression camera」無料配信

どんな人物画像でもOK

小口貴宏(Takahiro Koguchi)
小口貴宏(Takahiro Koguchi), @TKoguchi787
2020年09月29日, 午前 10:14 in news
0シェア
FacebookTwitter

日本のスタートアップEmbodyMeは、ビデオ会議で利用できるバーチャルカメラ「xpression camera」の無料配信を開始しました。当初はMac限定で、Windows版も近日公開します。なお、ダウンロードは公式サイトで登録したユーザーから順次行えます。

「xpression camera」は、任意の人物画像を1枚設定するだけで、画像の表情を自分の表情で乗っ取り、リアルタイムで動かせるアプリです。バーチャルカメラとして設定できるため、ZoomやGoogle Meetなど、あらゆるビデオ会議ツールで利用できます。自分のスーツ姿の写真を1枚登録しておけば、寝まき姿でも会議に臨めるといいます。

いわゆる「Zoom疲れ」を解消できる利点もあります。「Zoom疲れ」は自分の顔が画面に表示されて、ずっと見られていることを意識することが原因だといい、アバターを介するでこれを低減します。

一般的なノートPCで動作する点も利点の1つです。EmbodyMeの吉田一星代表取締役社長によると、同様の取り組みとしてはオープンソースを使った技術が存在するものの『ものすごいマシンがないとリアルタイムで動かない。クオリティ的にも完全ではなく、正面がくずれがちで、実用からは遠い』と語ります。その点「xpression camera」はMacBookなど一般的なマシンでも動作します。

いわゆるVTuberの取り組みにも似ていますが、VTuberの場合、キャラクターモデルの制作が高額なほか、一般的に2Dアニメキャラクターを使用するため、ユーザー層が限られる課題がありました。その点、自分の幼い写真や著名人1枚の写真で、自分の表情を憑依できる「xpression camera」はより広い層をターゲットにできるといいます。

技術的には、EmbodyMe独自の画像認識技術を活用。iPhoneのFace IDのような3Dセンサーを利用せず、画像認識のみで顔の5万か所以上の3Dポイントを推定し、表情をリアルタイムで追跡します。これに加えて、米国のオバマ前大統領のディープフェイク動画でも話題となった、深層学習技術の「GAN」(競争式生成ネットワーク)を活用。これにより、写真1枚から3D風アバターの生成が可能になります。

今後は、表情をトラッキングせず、音声のみで表情を擬似生成する技術も導入予定。家事やジョギングをしながら、場所の制約なくビデオ会議に参加できるようになります。

なお、現在はビデオ会議用のバーチャルカメラとしてリリースしているものの、同技術は遠隔での接客や教育現場、動画制作など、あらゆる用途への活用が期待できるといいます。例えば教育現場の場合、先生の顔ではない、親しみのあるキャラクターが授業をしたり、動画制作の現場においては、追加撮影をしなくても、すでにある動画をベースに、どんなセリフでもあとから言わせることが可能になるといいます。

筆者も実際に「xpression camera」を使ってビデオ会議をしたところ、いわゆる『不気味の谷』は超えられていないものの、画像から生成しているアバターにも関わらず、表情などがしっかり伝わることから、カメラをONにして会議している感は十分にありました。今後の技術進歩で「不気味の谷」を超えられた場合、フェイク出席者などに対する対策も考慮する必要はありそうです。

なお、開発元のEmbodyMeは、直近では昨年9月に約2.3億円の資金調達を実施しています。内訳はDEEPCORE、インキュベイトファンド、Deep30(東大松尾研究室のVC)、Techstars、SMBCベンチャーキャピタル、漆原茂氏を引受先とする第三者割当増資およびNEDOの研究開発型ベンチャー支援事業への採択による助成金となります。これまでの累計では約3.6億円を調達しています。

Source:xpression camera


【Engadget Live】iPhone 12発売日速攻レビュー

 

TechCrunch 注目記事新型コロナのソーシャルディスタンスを支援するビデオチャットアプリ8選

新型コロナウイルス 関連アップデート[TechCrunch]

 

関連キーワード: news, gear
0シェア
FacebookTwitter

Sponsored Contents