ブリストル大学、2つの動画内で行われている技能(手術、絵を描く、ピザ生地をこねる、箸を使う)を評価し、どちらが上手かを推定する手法を発表

ブリストル大学の研究者らは、動画で行われている技能を評価しランク付けする機械学習を用いた手法を発表しました。

論文:Who’s Better? Who’s Best? Pairwise Deep Ranking for Skill Determination
著者:Hazel Doughty Dima Damen Walterio Mayol-Cuevas

本稿は、2つの動画内で行わている技能のうち、どちらがレベルが高いかを推定する手法を提案します。技能には、手術、絵を描く、ピザ生地をこねる、箸を使うの4つでテストされました。

スキル判定ネットワークには、Temporal Segment Networks (TSN)に基づく、Two stream CNNを使用します。ビデオを複数のセグメンテーションに分割し、その中から3フレームを抜き出し技能評価に用います。

これらのことで、動画内で実演するスキルに基づいてビデオをランク付けすることを可能にし、精度結果は、上記4つの技能データセットから70%から83%の精度を達成しました。

アーカイブ

ページ上部へ戻る