Sponsored Contents

Robotsの最新記事

Image credit:
Save

Google DeepMind、強化学習でAIが障害物の回避・乗り越え方を体得。パルクール風の動きに進化

上手くいけばたくさん報酬、のしくみが強化に効く

Munenori Taniguchi
2017年7月11日, 午前07:00 in Robots
502シェア
62
280
0
160

連載

注目記事

米家電量販大手が音楽CD販売を終了へ。一方音楽ストリーミングではApple Musicがユーザー数を伸ばす

米家電量販大手が音楽CD販売を終了へ。一方音楽ストリーミングではApple Musicがユーザー数を伸ばす

View

人気記事

新型iPadが発売間近?「A1954」「A1893」の2モデルがEECのデータベースに登録(訂正)

新型iPadが発売間近?「A1954」「A1893」の2モデルがEECのデータベースに登録(訂正)

View
ポケモンGO、2月24日(土)はミニリュウ乱獲とカイリュー『りゅうせいぐん』学習チャンス。正午から3時間限定

ポケモンGO、2月24日(土)はミニリュウ乱獲とカイリュー『りゅうせいぐん』学習チャンス。正午から3時間限定

Ittousai, 2月23日
View
GoogleのAI開発子会社DeepMindが、2本足の棒人間風モデルにまるでパルクールのような走り方を覚え込ませています。これは強化学習の報酬システムを用いて方法で、複雑な環境下で報酬がどのようにはたらくかを調べているとのこと。

2本足しか無いモデルは画面上をひたすら右に向かって走ります。途中には段差やハードル、さらに底なしの谷などがレイアウトされており、それらをうまく避け、乗り越え、くぐり抜けられればそれに応じた報酬が得られる用に設定されています。

動画はすでにかなり強化学習が進んだ状態のもので、まるでゲームを人間が操作しているようにもみえるほど。中には高い塀のような傷害を乗り越えるために、まず膝をかけてからよじ登るといった動作も見られるものの、これらすべてがこの棒人間(AI)の独学による行動です。

DeepMindはこの実験で、強化学習が複雑な動きを覚えさせるためにも有効利用できることを示しました。おそらく、このように強化学習されたAIは将来、家の中にある階段や段差を自由に乗り越える必要がある家事ロボットなどに搭載されるのではとも考えられます。

DeepMindはこの研究を「Emergence of Locomotion Behaviours in Rich Environments」と題した論文にまとめArxiv.orgに発表しました。

腕の振りも独学なのか...?
Via: The Verge
関連キーワード: ai, deepmind, google, robots, tomorrow
502シェア
62
280
0
160

Sponsored Contents