新闻中心
News
分类>>英伟达强势推出HOVER!一个框架搞定机器人全身运动
英伟达强势推出HOVER!一个框架搞定机器人全身运动控制全身的类人机器人需要适应各种任务,比如导航、动作-操控、以及桌面操控,这些任务对控制方式的需求各不相同。 比如,导航主要依赖于控制机器人整体的移动速度,而桌面操控则更关注上半身的关节角度控制。 现有的方法通常针对每种任务模式分别训练专门的策略,但这限制了它们在不同模式之间的转移性。
因此,英伟达提出了 HOVER(Humanoid Versatile Controller),一种多模式的策略融合框架,将多种控制模式整合到一个统一的策略中。 HOVER能够在不同的控制模式间无缝切换,同时保留每种模式的特长B-Sports,提供了一种灵活、可扩展的类人控制方案。 这样一来,就不必为每种模式单独训练新策略,极大提升了控制效率和未来应用的灵活性。
训练框架:HOVER的策略是通过“神谕”策略(Oracle policy)来进行训练的,并结合了自身感觉(proprioception)和命令掩码来优化学习过程。 在这个过程中,任务命令会根据具体的模式和稀疏度,为上半身和下半身分别设置不同的掩码,帮助系统生成多样化的任务命令模式,从而细化输入信息。
在训练过程中,HOVER利用一种叫做DAgger的技术来使学习到的策略更接近“神谕”策略,通过监督学习的方式让HOVER的动作与神谕一致。这种方法能够逐步提升系统的响应准确性,让HOVER更高效地掌握不同任务模式的控制方法。
HOVER在前进行走时成功地从ExBody模式切换到H2O模式,如图(a)所示;在进行转身和行走时,又从HumanPlus模式切换到全域H2O模式,如图(b)所示。
部署框架:HOVER通过一个统一的多模式指令空间,提供灵活的类人机器人控制。这个多模式空间支持三种控制方式:运动位置跟踪(蓝色)、局部关节角度跟踪()、以及根部位置跟踪(紫色)。高亮的方框显示当前正在执行的指令,而右侧的虚线框(掩码)则可以选择性地激活不同的指令空间,以适应不同任务需求。