コニカミノルタ株式会社の研究者は、複数人の2Dポーズをリアルタイムに検出する「Pose Proposal Networks(PPN)」を発表しました。
論文:Pose Proposal Networks(ECCV’18)
著者:Taiki Sekii/関井 大気
a:入力画像。b:身体部位のバウンディングボックスを検出。c:bと同じCNNで部位の接続を検出。d:個々の人物に分解
本論文は、物体検出のフレームワークを活用して複数人の姿勢推定をリアルタイムに実行するCNNを用いたEnd-to-endのアプローチを提案します。
本提案手法は、リサイズ後の入力画像からRegion proposal (RP/物体領域候補予測) フレームワークで身体部位のバウンディングボックスを検出し、同じCNNを使って部位の接続も検出します。そして、これらをマッチングさせ関連付けることで、ポーズを生成します。
これにより、画像から複数人の2Dポーズを高速に検出することができ、MPII Human Poseデータセットの実験結果では、既存研究より高い精度を叩き出すことに成功し、人の2D姿勢推定において速度と精度のトレードオフの改善を実証しました。