UCバークレーら、仮想キャラクタのアクロバットな動きをよりリアルに再現する強化学習を用いた手法「DeepMimic」発表

カリフォルニア大学バークレー校とブリティッシュコロンビア大学の研究者らは、コンピューターアニメーションキャラクタのアクロバットな動きも、よりリアルなものにする強化学習を用いた手法「DeepMimic」を発表しました。

提案手法は、強化学習フレームワークを用いて、ブレイクダンスや武道のようなアクロバットな動きもコンピュータアニメーションで自然な動きとして再現する手法を提案します。

フレームワークにキャラクタ、参照動作（基準動作）、タスク（目的の動き）を与えることで、ベースとなる参照動作を模倣しながらタスクを実行することを学習します。スキルを熟達するまで何度も訓練します。

（キャラクタ：ヒューマノイド。参照動作：回し蹴り。タスク：蹴る場所を指定）

エピソードの開始時に、ランダムにサンプリングされた状態に初期化すること、失敗した時にすぐエピソードを終了すること、これらのことで効率的に学習することを実現します。

（青：シミュレーション。緑：参照動作）

本フレームワークを使用すると、行動を細かく計画するのではなく、目的の行動を与えることでキャラクタに練習を通して熟達させることができます。また、スキルを別のキャラクタ、別の環境、別のタスクにリターゲットすることも可能。さらに、組み合わせて複数のスキルを実行することも可能です。

これらにより、キャラクタによるアクロバットな動きでも、より自然に生成することが容易になります。動画では、自然な動きを確認できます。

追記（2018.8.14）

筋肉や皮膚をシミュレートするシステムなどを開発するZiva Dynamicsからのレンダリングで、DeepMimicを用いて、ライオンを再現した動画が公開されました。