Google、機械学習用オープンデータセットを収集するため、世界中の人たちに落書きしてもらうWebサービス「Quick, Draw!」を発表。現在100ヶ国から8億枚の収集に成功

Googleは、機械学習のデータセットを集めるため、世界中の人たちに落書きをしてもらうWebベースのサービス「Quick, Draw!(英語のみ)」を利用してオープンでグローバルな、成長するデータセットの研究を発表しました。

「ユーザーの背景」や「人のバイアス」のかかった落書きを機械学習の訓練用データセットとして利用するニーズに答えるため、半年前から「Quick, Draw!」というWebサービスを開始、現在までに100カ国2千万の人々から8億回の描画が行われ、収集に成功しました。

Quick, Draw!というサービスは、ユーザーが書いた落書きをリアルタイムにコンピュータが推測するというもので、20秒以内に描画される落書きをニューラルネットワークを基に推測するゲームです。Catを20秒以内に描いてとお題も出されます。こちらからすぐに試すことができます。

そして、これら収集したデータセットを誰もが使えるように、オープンデータセットとして現在5000万枚の画像が公開されています。公開先は、Quick, Draw!のホーム画面にリンクが貼られているので、そちらから世界最大の落書きデータセットへアクセスすることが可能です。

分析

また、同社はそのデータセットを使用して、オブジェクトのビジュアルパターンを分析しました。

それは、例えばデータセット内のCatの絵を何千枚と重ね、複合イメージを作成するというもので、世界中でどんなCatが描かれているのか、また各国のCatの傾向はどんなものかと調査したりといったことを可能にします。

上記GIFは、世界各地の1000点のCatの絵から作られた複合Catです。つまり、人間はCatを落書きする時、出力する時、イメージする時、多くの場合2本の立て耳がついた正面を向いた顔をイメージすると。

分類

また、同社(PAIR)が公開している機械学習用データセットをヴィジュアルベースで分類できる「Facets(過去記事参照)」に今回のデータセットを落とし込むと、視覚的にパターンを分析することもできます。

これにより、例えば、翻訳のために地域言語の優先順位を決める方法を理解するのに役立てたり、そういったグローバルベースのサービスへの展開に役立つとしています。

 

関連

人とAIの共存を主とする「Google PAIR」、機械学習(NN含む)をブラウザ上で全て実行できるWebMLライブラリ「deeplearn.js 0.1.0」をリリース | Seamless

アーカイブ

ページ上部へ戻る