ミュンヘン工科大学など、RGB-Dセンサから3Dセマンティックセグメンテーションを推定する機械学習を用いた手法「3D-SIS」発表

ミュンヘン工科大学とスタンフォード大学の研究チームは、RGB-Dスキャンにおける3Dセマンティックインスタンスセグメンテーションのためのニューラルネットワークアーキテクチャ「3D-SIS」を発表しました。

論文:3D-SIS: 3D Semantic Instance Segmentation of RGB-D Scans

著者:Ji Hou, Angela Dai, Matthias Nießner
所属:Technical University of Munich, Stanford University

本論文は、RGB-Dセンサで記録したマルチビューを使用して、2Dカラー画像 と3Dジオメトリデータから学習するニューラルネットワークを提案します。これにより、オブジェクトバウンディングボックス、クラスラベル、インスタンスマスクの正確な予測を実現します。

本提案手法は、3D region proposal network (3D-RPN)と、3D region of interest pooling layer (3D-RoI)というネットワークを用いて、オブジェクトバウンディングボックスの位置、クラスラベル、およびボクセルごとのインスタンスマスクを推定します。

 

ABOUT

 本サイト(Seamless/シームレス)は、2014年に始めた先端テクノロジーの研究を論文ベースで記事にしているWebメディアです。山下が個人で運営し、執筆を行っています。現在は主に寄稿(ITmedia NEWS)と、Seamless Journalに専念しています。

連絡先:yamashita(at)seamless.jp
Subscribe:TwitterFacebookHatenaNewsPicks

ゲスト連載:プロジェクションマッピング技術の変遷 岩井大輔

 Seamless Journalとは、月額10ドルの課金で厳選した最新論文がほぼ毎日メールボックスに届くというものです。記事にならない気になる論文をお届けします。決済はPatreonを介して、クレジットカードおよびPayPalで行え、解約も同サービスからいつでも可能です。お申し込みはこちらから

ページ上部へ戻る