Google Brain、強化学習において、報酬の最大化だけでなく、エージェントの身体的デザインも同時に学習するアプローチを発表

Google Brainの研究者は、強化学習において、脳内だけでなく、環境に最適なボディデザインも学習することで、より高いパフォーマンスを達成させる手法を発表しました。

論文:Reinforcement Learning for Improving Agent Design

著者:David Ha
所属:Google Brain

本論文は、強化学習において、報酬を最大化するだけでなく、同時にエージェントのデザインも学習するアプローチを提案します。デザインとは、例えば、二足歩行のエージェントの場合、足の長さや向き、角度などの設計部分を指します。

多くの強化学習における研究は、所定のボディデザインでエージェントの行動を制御するためのポリシーを学習します。しかし、そのボディデザインが環境に最適かは分からないわけで、本研究は、そのタスクにより適しているエージェントのボディデザインも学習することで精度を高めることを目的とします。

エージェントの身体をより良いバージョンで学ぶことは、より良いパフォーマンスを達成するのに役立つだけでなく、エージェントがより効率的にポリシーを学ぶことにもなります。

ABOUT

 本サイト(Seamless/シームレス)は、2014年に始めた先端テクノロジーの研究を論文ベースで記事にしているWebメディアです。山下が個人で運営し、執筆を行っています。現在は主に寄稿(ITmedia NEWS)と、Seamless Journalに専念しています。

連絡先:yamashita(at)seamless.jp
Subscribe:TwitterFacebookHatenaNewsPicks

ゲスト連載:プロジェクションマッピング技術の変遷 岩井大輔

 Seamless Journalとは、月額10ドルの課金で厳選した最新論文がほぼ毎日メールボックスに届くというものです。記事にならない気になる論文をお届けします。決済はPatreonを介して、クレジットカードおよびPayPalで行え、解約も同サービスからいつでも可能です。お申し込みはこちらから

ページ上部へ戻る