Disney Research等、音声データからそれに合わせた顔面アニメーションを生成するDeep Learningアプローチを論文にて公開

Disney Research、イングランド:イースト・アングリア大学、カリフォルニア工科大学、カーネギーメロン大学の研究者たちは、音声データからそれに合わせたフェイシャル・アニメーションを自動的に生成する機械学習アプローチを論文にて公開しました。

A Deep Learning Approach for Generalized Speech Animation(PDF)

本アプローチは、Deep Learningで訓練されたシステムを使用して、任意の単一スピーカーからの音声を分析、対応する口形を自動的に生成、自動音声アニメーションの顔モデルに適用することができます。

音声データから口元のアニメーションに変換し、キャラクターの顔にリターゲットすることを可能にします。

下のGIFは、右がオリジナルで、左が本パイプラインから生成したアニメーションです。

 

関連

NVIDIAの音声入力から3D顔面モデル・アニメーションを駆動させる機械学習ベースの技術がSIGGRAPH 2017にて採択 | Seamless

アーカイブ

ページ上部へ戻る