地图是人类构造的。通过地图这一媒介,人们可以通过空间的表现方式来认识空间。地图中的符号和描述语言都是通用的,因此人类在熟悉的或者陌生的地方都可以使用地图来导航。这是一项重要的技能,目前军方仍然在使用指南针和地图训练导航能力。
《街道导航的跨视角政策学习》
DeepMind(一家总部位于英国的人工智能公司,与谷歌同属于Alphabet)6月13日发表了名为《街道导航的跨视角政策学习》(Cross-View Policy Learning for Street Navigation)的一份报告。这份报告是对一项实验的评估,目的是测试人工智能能否通过使用地图来训练导航,而不需要像自主导航工具那样为其绘制大量路线。
报告作者指出,“目标驱动的街道导航代理到目前为止还不能在没有经过大量再培训的情况下转移到不可见的区域,而且依赖模拟并不是一个可扩展的解决方案,由于航空图像很容易在全球范围内获取,因此我们建议对地面和空中视图训练一种多模式的方法,然后利用空中视图观测将地面视图方法转移到城市中不可见的(目标)部分。”
这种方法与自动驾驶汽车导航算法训练方式的不同之处在于,它增加了自上向下的地图作为参考点,并且在导航模型中使用了全新的信息。传统的自主导航算法是通过已经绘制好的图像来运行的,这些图像是储存在机器人大脑中的扫描数据,用来教它如何在熟悉的道路上行驶。
研究人员写道:“人类通过阅读地图就能快速了解一个新城市,这一发现启发了我们,我们试图将类似的自上而下的视觉信息整合到导航代理的训练过程中,以帮助它们推广到以前从未见过的街道上。我们没有使用人类绘制的地图,而是选择了航空图像,因为它在世界各地都很容易获得。此外,一旦人们熟悉了一个环境就可以不用地图了。这种人类的多样性激发了我们对灵活的RL代理的培训工作,这些代理既可以使用第一人称视图,也可以使用自上向下的视图来执行。”
测试过程
为了测试这种新方法,人工智能在一个陌生的地方模拟运行,选择向前走、向左或向右转、向左或向右转到更大程度。人工智能使用全景街景图像对周围的环境导航,有时使用地图视图运行。在实验中,使用地图视图的人工智能比不使用地图视图的人工智能更容易成功地导航到它需要到达的地方。
对于可使用精确数据的陌生区域,使用这样的算法指导军用车辆是很有用的。尽管在地球上几乎所有地方都能获得一些高质量的卫星影像,但街道级的影像——尤其是用激光雷达绘制的街道级影像,以及用驱动算法迭代的影像,则要少得多。与预先精确模拟的路径相比,基于自己的传感器和地图来教机器人在太空中行走的工作量要小得多,而且更匹配大多数远程控制和自主系统目前的能力。从本质上讲,它只是实现了人类在GPS下拉菜单上选择路径点的功能,唯一的好处是,人工智能可以自己导航,而且是独立于GPS设计的。DARPA正在寻找能够基于精确数据提供军事用途的人工智能,DeepMind的地图学习导航工具可能会满足类似的需求。
DeepMind的研究人员在论文的开头和结尾都讲了件趣事:欧内斯特·沙克尔顿(Ernest Shackleton)的团队如何首先使用一张地图,然后当地图失效时,用地图的记忆绘制一条从废墟中出来的道路。
对于沙克尔顿来说,地图的记忆是一种逃避未知的工具。对于五角大楼来说,能够读取地图的人工智能则可能是一种挑战未知的方式。