Yang et al
Yang et al

赤ちゃんが生まれてから初めて自分の足で立つには、両親の手助けもあるかもしれないものの、つかまり立ちを経て、試行錯誤と体験を繰り返して立つ感覚を覚え、そして歩けるようになってゆきます。

一方、Boston DynamicsのAtlasやSpotといった先進的なロボットは、人間や動物に近い運動能力を得てはいるものの、それらの基本的な動作はプログラムされたもので、自ら立ち方や歩き方を学習したわけではありません。そのため、ソフトウェア上で想定していない状況に陥ったとき、自ら正常状態に復帰できない場合があるかもしれません。

中国・浙江大学と、スコットランド・エディンバラ大学の研究チームは、四脚ロボットが転倒状態から、自ら立ち上がる方法を覚えるためにソフトウェア上でAIを強化学習する方法を開発しました。

スキルごとに、たとえば「歩行」や「バランス」など、8種類に分けたAIのディープニューラルネットワークをそれぞれ鍛え、ソフトウェア上のロボット犬がうまくタスクをこなせれば、CGに描いたドッグフード…ではなく、デジタルでの褒美となる報酬ポイントを与えました。逆に下手をした場合も、罰ではなく、デメリットポイントを与えて再発をしないよう覚えさせます。これを繰り返すことで、研究チームは8種類のスキルそれぞれにAIのエキスパート作り上げました。

研究チームは次に、8種類のAIを統率し優先順位を付けるネットワークを構築、司令塔として機能させ、どのスキルを最優先または複数組み合わせ、いかに姿勢を制御するかを指示させるようにしました。たとえば、ロボットが転倒して再び立ち上がろうとする場合、AIシステムはその動きを検出し、身体のバランス処理専門のAIを呼び出してまず体勢を整えさせるといったことができます。

Yang et al
Yang et al

デジタル空間でロボット犬が蹴躓きやすい障害物を敷いた場所を歩かせる実験では、ロボットがバランスを崩した際にきちんとAIが姿勢を修正させつつ、目標物を追いかけて歩かせることに成功しています。そして、そのソフトウェアを実際のロボット犬に搭載して、同じように砕石などを敷き詰めた床を歩かせたところ、きちんと倒れずにバランスを維持することができました。また研究者が棒でロボットを突き倒した場合も、立ち上がるスキルによってロボット犬は足を折りたたみ、身体を水平にしてからうまく立ち上がることができました。

Yang et al
Yang et al

論文著者のひとりZhibin Li氏は、この研究ではロボットのAIを鍛えるためのシミュレーションにおける計算の負荷が高すぎるのが問題だと述べています。実際に様々なスキルを覚えさせあらゆる場面で問題なく動き回れるようにするには、まだまだ膨大な計算作業が必要であり、その計算量をできるだけ少なくすることが今後の課題だとしました。

もし、このスキルごとのAIの計算量を大きく減らすことができれば、たとえばサッカーや野球を(それぞれのポジション特有のスキルを駆使して)プレーできるほど、運動能力や応用力に優れたロボットが作れるようになるかもしれません。

source:Science Robotics

via:Wired