Seamless

V i r t u a l R e a l i t y

ジョージア工科大学ら、描いたスケッチから現実的な画像を生成する敵対的生成ネットワークGANを用いた手法を発表

ジョージア工科大学とArgo AIの研究者らは、人が描いたスケッチから現実的な写真を生成する機械学習を用いた手法を発表しました。

論文:SketchyGAN: Towards Diverse and Realistic Sketch to Image Synthesis
著者:Wengling Chen, James Hays
GitHub – wchen342/SketchyGAN

本稿は、スケッチから画像を合成する敵対生成ネットワークGAN(Generative Adversarial Network)を用いたエンドツーエンドの手法を提案します。入力は、オブジェクトを示すスケッチで、出力は類似のオブジェクトを含む現実的な画像です。

似た画像を検索してくるのではなく、スケッチから新しい画像を生成します。

データセットは、Flickr APIを使用してFlickrから50個のカテゴリ2,299,144枚の画像を収集しました。生成器(generator)と識別器(discriminator)の両方は、MRU(Masked Residual Unit)ブロックモジュールで構築され、主に画像と作成したエッジマップのペアをデータに訓練します。