更快地了解机器人技术 以帮助我们处理混乱的人类环境
为了能够快速导航不可预测和无序空间的家庭辅助机器人,密歇根大学的研究人员开发出一种算法,可让机器比以前的方法更快地感知其环境的数量级。
“机器人感知是提供可以部署到人们家中的有能力的辅助机器人的最大瓶颈之一,”Karthik Desingh说,他是计算机科学与工程的研究生,也是发表在Science Robotics上的一篇论文的主要作者。
“在工业环境中,有结构的地方,机器人可以很快完成建造汽车等任务。但我们生活在非结构化的环境中,我们希望机器人能够处理我们的混乱。”
从历史上看,机器人在结构化环境中最有效地运行,在护栏或笼子后面,以保证人类安全,机器人的工作空间整洁有序。然而,在工作或家庭中,人类的环境通常是各种状态下的混乱物体:键盘上的纸张,隐藏车钥匙的袋子或隐藏半开橱柜的围裙。
该团队的新算法称为非参数信念传播的拉消息传递。在10分钟内,它可以计算出对象姿势或位置和方向的准确理解,达到一定程度的精确度,以前的方法超过一个半小时。
该团队使用Fetch机器人演示了这一点。他们表明,他们的算法可以正确地感知和使用一套抽屉,即使是半满的毯子,抽屉半开时,或机器人的手臂本身隐藏抽屉的完整传感器视图。该算法还可以从简单的修整器扩展到具有多个复杂关节的对象。他们表明,机器人可以准确地感知自己的身体和抓手臂。
“我们的算法背后的概念,如非参数信念传播,已经被用于计算机视觉,并且在捕捉我们世界的不确定性方面表现很好。但是这些模型对机器人技术的影响有限,因为它们在计算上非常昂贵,需要更多时间交互式机器人可以帮助完成日常任务,“密歇根州机器人研究所的计算机科学与工程教授兼核心教员Chad Jenkins说。
以前的技术依赖于“推送消息”
非参数信念传播技术以及类似的粒子消息传递技术于2003年首次发布。它们在计算机视觉方面很有效,它试图通过图像和视频全面了解场景。这是因为二维图像或视频比机器人感知中涉及的三维场景需要更少的计算能力和时间。
这些早期方法通过将场景转换为节点和边的图模型来理解场景,这些图表模型表示对象的每个组件及其彼此之间的关系。然后,当给定一组约束时,算法假设 - 或创建组件位置和方向的信念。研究人员称之为粒子的这些信念在各种概率上都有所不同。
为了缩小最可能的位置和方向,组件利用“推送消息”来跨节点和返回发送可能的位置信息。然后将该位置信息与传感器数据进行比较。这个过程需要多次迭代才能最终达到场景的准确信念。
例如,给定具有三个抽屉的梳妆台,物体的每个部件 - 在这种情况下,每个抽屉和梳妆台本身 - 将是节点。限制条件是抽屉必须在梳妆台内,抽屉横向移动但不垂直移动。
在节点之间传递的信息与来自传感器的实际观察结果进行比较,例如2-D图像和3-D点云。通过迭代重复这些消息,直到信念和传感器数据之间达成一致。
新算法转向“拉消息”
为了简化计算需求,Desingh和密歇根团队利用了所谓的“拉动消息”。他们的方法将来回信息密集的消息的杂音变成对象组件之间的简洁对话。
在该示例中,代替修整器仅在计算来自其他抽屉的信息之后将位置信息发送到抽屉,修整器首先检查抽屉。它要求每个抽屉都有自己对其位置的信念,然后,为了准确,将这种信念与来自其他抽屉的信息相比较。它通过迭代收敛于对场景的准确理解,就像推进方法一样。
为了直接将他们的新方法与以前的方法进行比较,他们在一个圆形的简单二维场景上测试了它,其中四个矩形臂隐藏在类似圆形和矩形的图案中。
以前的方法每次迭代需要超过20分钟的处理时间才能传递消息,而团队的新方法只需不到两分钟,随着信念或粒子数量的增加,这种改进的指数也会快得多。
在这些试验中,他们用新算法进行了五次迭代,以便在抽屉和修整器的位置估计中实现小于3.5英寸的平均误差,或者当修整器被部分遮挡时,位置估计的平均误差小于8英寸。毯。
这与以前的方法相同,并且取决于对象的大小,部件的数量以及传感器可见的程度。最重要的是,准确度的提高足以让机器人通过持续的迭代成功操纵物体。
“这是我们可以利用的信念做仅仅是开始传播在机器人的感知,” Desingh说。“我们希望将我们的工作扩展到多个对象并在动作执行期间跟踪它们,即使机器人当前没有查看对象。然后,机器人可以利用这种能力不断观察世界,以实现面向目标的操作和成功完成任务。“