UC伯克利、CMU和FAIR推出的快速运动适应(RMA)算法,可以使四足机器人实时、在线地适应未见过的地形环境,性能表现显著优于其他腿式机器人。
说到腿式机器人,机器之心以前介绍过不少,如能跑、能跳、能跳绳、跨越障碍的Spot机器狗,不用摄像头和激光雷达凭感觉「越野」的ANYmal机器人、会翻跟斗的MIT机器人,等等。这些腿式机器人都有一定的适应外部环境的能力,但还不够。腿式机器人在现实世界的成功部署需要其实时适应未见过和不断变化的场景,如多样化的地形、不同重量的负载以及不同程度的磨损。近日,来自UC伯克利、CMU和FAIR的研究者们在腿式机器人实时、智能适应具有挑战性、陌生的地形和环境方面取得了重大突破,推出了一种快速运动适应(RapidMotorAdaptation,RMA)算法。该算法包含两个子策略,其一是使用强化学习训练的基本策略(basepolicy)和使用监督学习训练的适应模块(adaptationmodule),二者完全在模拟中学习。在RMA算法加持下,四足机器人拥有了所有智能体共有的适应环境因素的能力。论文