OpenAIなどによる研究チームは、RL(Reinforcement learning、強化学習)エージェントのための大規模マルチエージェントゲームプラットフォーム「Neural MMO」を発表しました。
論文:Neural MMO: A Massively Multiagent Game Environmentfor Training and Evaluating Intelligent Agents
著者:Joseph Suarez, Yilun Du, Phillip Isola, Igor Mordatch
所属:Stanford University, MIT, OpenAI, UC Berkeley
本論文は、MMORPG(Massively Multiplayer Online Role-Playing Game、大規模多人数同時参加型オンラインRPG)からインスパイアされた大規模マルチエージェントゲームプラットフォームを提案します。マルチエージェント学習のための研究プラットフォームとして活用してもらうため、オープンソース化しています。
MMORPGは、1つの世界に複数のプレイヤが遠く離れた環境から同時に参加し、生き残るため、かつ持続的に競争するオンラインゲームです。本提案は、そのゲーム特性を用いて、各エージェントがRLを使って生き残ることを学ぶニューラルネットをシミュレートします。
エージェントは、自動生成されたタイルベースのフィールド(森林、草、石、水など)が含まれるインスタンスに自由に参加できます。参加すると、健康を維持するために(健康が0になると死亡)、食料と水を手に入れなければなりません。その為に、移動し攻撃(3つの攻撃オプション)を仕掛け奪い合います。報酬を与え、生き残るための知的な戦略を学習させます。
実験結果では、エージェントの増加は争いを避けるため探査を拡大することが分かりました。他にも、異なる種の数が増えると、他の種集団との競合を避けるために分離する傾向があることが分かりました。