デラウェア大学ら、動的な人の3Dモデルによる自由視点動画をニューラルネットワークを用いて最適化する手法を発表

米国デラウェア大学と上海科技大学の研究者らは、取得した動的な人の3Dモデルデータをニューラルネットワークを用いて最適化する手法を発表しました。

論文：4D Human Body Correspondences from Panoramic Depth Maps
著者：Zhong Li,Minye Wu,Wangyiteng Zhou,Jingyi Yu

スキャンした動的な人の3Dモデルを任意の視点から閲覧できる「FVV（free-viewpoint video/自由視点動画）」は、データ容量が大きいためユーザエンドデバイスへのリアルタイム伝送など転送に困難なのが現状であり課題でもあります。

そこで、本稿では、人の再構成されたデータサイズを品質を落とすことなく軽減するため、生成された深度マップ上の特徴記述子を訓練し、ニューラルネットワークを用いて圧縮することで課題に対しての解決策の一助を提案します。

本提案手法は、入力に同心モザイクによるレンダリングでPDM（panoramic depth maps）を生成し、ピクセル単位の特徴記述子を学習、データを圧縮するためのエンドツーエンドdeep learningを用いるスキームで行います。

これらのことで、マッチングのためのより信頼性の高い特徴記述子となり、高い圧縮率と低い損失を実現します。