カリフォルニア大学バークレー校による研究チームは、1枚の2D静止画像から人物の過去と未来の3Dポーズの動きを推定する機械学習を用いたフレームワークを発表しました。
論文:Learning 3D Human Dynamics from Video
Angjoo Kanazawa(University of California, Berkeley)
Jason Y. Zhang(University of California, Berkeley)
Panna Felsen(University of California, Berkeley)
Jitendra Malik(University of California, Berkeley)
本論文は、1枚の画像から、画像内の人物の過去と将来における姿勢の変化を予測するエンドツーエンドモデルを提案します。本提案は、ビデオから動画内の人物の2Dポーズを抽出し学習することで可能にします。学習されたモデルはフィードフォワード方式でビデオから現在、過去、未来の3Dメッシュを復元します。データセットは、インターネット上の動画から2D姿勢を抽出し使用します。これにより、時間的に一貫性のある人物3Dメッシュを推定することができます。