Google Researchは、PAIRと協力して、機械学習データセットの理解と分析を支援するオープンソースの視覚化ツール「Facets」をGitHubにて公開しました。
GitHub – PAIR-code/facets: Visualizations for machine learning datasets
機械学習の力は、大量のデータからパターンを学習する能力にあり、強力な機械学習システムを構築するにはデータを分析し理解することが不可欠になってきます。
しかし、機械学習データセットは、数億個のデータポイントが含まれているため全体を理解することは非常に困難です。
そこで、機械学習データセットをインタラクティブな視覚化、データビジュアライゼーションすることで理解に繋げるアプローチを提案、それを支援するのが本ツールです。
視覚化は、同社が開発したJavascriptライブラリ「Polymer」Webコンポーネントとして実装され、分析作業を行うためのツール「Jupyter Notebook」やWebページに簡単に埋め込むことができます。
デモWebサイトも作成されており、こちらからインタラクティブ操作含め体験することができます。