训练机器人识别和倒水
GauthamNarasimhan于2020年在机器人研究所获得硕士学位,他与该研究所机器人感知和做实验室的一个团队合作,利用人工智能和图像翻译来解决这个问题。
图像翻译算法使用图像集合来训练人工智能将图像从一种风格转换为另一种风格,例如将照片转换为莫奈风格的绘画或使马的图像看起来像斑马。在这项研究中,该团队使用了一种称为对比学习的方法来进行未配对的图像到图像转换(简称CUT)。
“在学习的训练阶段,你需要某种方式告诉算法正确和错误的答案是什么,”为Narasimhan提供建议的机器人研究所助理教授DavidHeld说。“然而,标记数据可能是一个耗时的过程,特别是在教机器人倒水时,人类可能需要在图像中标记单个水滴。”
进入马和斑马。
“就像我们可以训练模型将马的图像转换成斑马一样,我们也可以类似地训练模型将有色液体的图像转换为透明液体的图像,”Held说。“我们使用这个模型使机器人能够理解透明液体。”
像水这样的透明液体很难让机器人看到,因为它反射、折射和吸收光线的方式因背景而异。为了教计算机如何通过一杯水看到不同的背景,该团队在装满水的透明玻璃杯后面播放YouTube视频。以这种方式训练系统将允许机器人在现实世界的不同背景下倒水,无论机器人位于何处。
“即使对于人类来说,有时也很难准确地确定水和空气之间的边界,”Narasimhan说。
使用他们的方法,机器人能够将水倒到玻璃杯中的一定高度。然后用不同形状和大小的眼镜重复实验。
Narasimhan说,未来的研究还有扩展这种方法的空间——增加不同的照明条件,挑战机器人将水从一个容器倒入另一个容器,或者不仅估计水的高度,而且估计水的体积。
该研究于上个月在费城举行的IEEE机器人与自动化国际会议上发表。Narasimhan说,对这项工作的反应是积极的。
“当研究在现实世界中进行而不仅仅是在模拟中时,机器人技术领域的人们真的很欣赏它,”Narasimhan说,他现在在俄亥俄州哥伦布市的PathRobotics担任计算机视觉工程师。“我们想做一些非常简单但有效的事情。”