2022年07月26日更新 使用自然语言反馈纠正机器人计划

詹昭苇
导读 机器人将受益于整合自然语言反馈以改变其行为的能力。arXiv org 最近的一篇论文建议使用自然语言指令作为输入来直接修改机器人的规划目

机器人将受益于整合自然语言反馈以改变其行为的能力。arXiv.org 最近的一篇论文建议使用自然语言指令作为输入来直接修改机器人的规划目标。

研究人员建议学习一种将视觉观察和自然语言校正映射到剩余成本函数的模型。

用户可以在执行过程中随时修改或明确机器人的目标或在运动优化过程中引入额外的约束。该框架与常用的运动规划器成本无缝集成,例如避免碰撞、关节限制和平滑度。

在涉及非模板化自然用户命令、杂乱场景和新对象类型的各种真实世界设置中对模型的评估表明,语言界面可以成功纠正本地规划器的故障。

当人类为机器人设计成本或目标规格时,他们通常会产生模棱两可、未指定或超出规划者解决能力的规格。在这些情况下,校正为人在环机器人控制提供了有价值的工具。更正可能采用新目标规范、新约束(例如,避免特定对象)或规划算法提示(例如访问特定航路点)的形式。现有的校正方法(例如使用操纵杆或直接操纵末端执行器)需要完全远程操作或实时交互。在本文中,我们将自然语言作为一种用于机器人校正的富有表现力和灵活的工具进行探索。我们描述了如何从自然语言句子映射到成本函数的转换。我们表明,这些转换使用户能够正确的目标,更新机器人动作以适应其他用户偏好,并从计划错误中恢复。这些更正可用于在原始计划者失败的任务中获得 81% 和 93% 的成功率,只需进行一到两种语言更正。我们的方法可以在模拟环境和现实环境中组合多个约束并泛化到看不见的场景、对象和句子。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!