如何训练无人驾驶汽车?Waymo给的方案是“虚拟世界+虚假城市”
据大西洋月刊报道,在谷歌母公司Alphabet的园区一角,有个团队正在开发一款软件,它对无人驾驶汽车来说至关重要。到目前为止,还没有任何记者看到过它。研发团队称这款软件为Carcraft,显然是从深受欢迎的视频游戏《魔兽世界》(World of Warcraft)身上获得了灵感。
图1:Alphabet旗下雄心勃勃的无人驾驶项目
这款软件的开发者是个头发蓬乱、长着一张娃娃脸的年轻工程师,他叫詹姆斯·斯托特(James Stout)。他和我(本文作者,大西洋月刊负责科技专栏的副主编阿莱克西斯·马德里加尔(Alexis C. Madrigal))在开放式办公室里安静地坐着。屏幕上显示着环形路口示意图。对于人类的眼睛来说,这些图没什么可看的,只有简单的线条图呈现在道路纹理的背景上。我们在中等分辨率下看到无人驾驶的克莱斯勒Pacifica,旁边简单的线框显示出另一辆车的存在。
图2:Alphabet无人驾驶子公司Waymo的模拟建筑软件Carcraft
几个月前,有个无人驾驶汽车团队在德克萨斯州遇到了这样的环状交叉路口。在这种情况下,高速和复杂性使无人驾驶汽车感到困惑,因此他们决定在测试设备上建造外观相似的物理通道。我所看到的是这个学习过程中的第三个步骤,即现实世界驾驶数字化。在这里,一个现实世界的驾驶动作(就像汽车在环状交叉路口上)可以被成千上万倍地放大到的模拟场景中,以此来探测汽车能力的边缘。
这样的场景为该公司强大的模拟测试提供了基础。斯托特告诉我:“我们看到的绝大多数工作都是由模拟的东西所驱动的。”它就是Waymo加速无人驾驶汽车开发的工具。2016年12月,Alphabet将无人驾驶项目从研究机构X中剥离出来,成为独立业务。如果Waymo能够在未来几年推出全自动驾驶汽车,那么这种以重塑现实世界为目标、创造虚拟世界为基础的Carcraft将会立下大功。
最初开发Carcraft的初衷是作为汽车在公路上行驶经历的“场景回放”手段,现在Carcraft在无人驾驶计划中扮演越来越重要的角色。在任何时候,通过Carcraft重建的模拟城市——奥斯汀、山景城、凤凰城以及其他测试场中,都有25000辆虚拟无人驾驶汽车正在行驶。
仅仅在一天内,Waymo就可能在路况特别复杂的地方模拟成千上万次驾驶。现在,Waymo汽车每天在虚拟世界中行驶的里程数超过1287万公里。在2016年,他们的虚拟总里程数达到40亿公里,而在真实公路上行驶的谷歌无人驾驶汽车则行驶了483万公里。至关重要的是,虚拟里程集中在Waymo称之为“有趣的地方”,他们可能会从中学到许多东西。
这些模拟是Waymo开发的一个错综复杂系统的组成部分。他们的无人驾驶汽车在公共道路上行驶了数百万公里,同时在名为“城堡”的中央山谷秘密基地中进行“结构化测试”。Waymo从来没有公开过这个系统。他们在常规道路上行驶的里程数显示,有些地方他们需要额外练习。他们将这些地方雕刻入城堡里,以便在原地体验数以千计不同的场景。
在两种现实世界的测试中,他们的汽车捕捉到足够多的数据,在未来的任何时刻都能创造出完整的数字娱乐。而在虚拟空间中,他们可以从现实生活的极限中脱离出来,创造出成千上万个单一场景的变体,然后驾驶虚拟汽车通过所有的场景。随着驱动软件的改进,它再被下载回物理汽车中,从而可以驱动越来越多的里程。这个过程周而复始,往复循环不断。
为了抵达“城堡”,你需要从旧金山湾驾车向东出发,然而向南转往99号公路,沿着中央山谷高速公路向南行驶到弗雷斯诺(Fresno)的阿特沃特小镇。这里比旧金山热30摄氏度,曾作为卡斯尔空军基地,最繁华时曾雇佣了6000人来参与B-52项目。现在,它位于默塞德小都市区的北部边缘,那里的失业率在2010年代初突破了20%,而且仍然很少下降到10%以下。这里有40%的人说西班牙语。
离开阿特沃特镇,我们穿过一些铁路,转向从前留下的老基地,现在那里被改造成了默塞德动物控制中心和阿特沃特监狱。我的手机并未指向具体地址,而是提供了GPS坐标。我们沿着高大而不透明的绿色栅栏前进,直到谷歌地图告诉我们停下来。这里似乎没有任何东西,甚至就连门看起来也很像另一段栅栏,但我的Waymo主人很自信。果然,一个保安出现了,然后从裂缝中滑出来,并检查我们的证件。
图3:城堡外围的栅栏
通过栅栏部分,我们开车进入一个熙熙攘攘的小园区。许多穿着短裤、戴着帽子的年轻人走来走去。还有可移动的建筑、圆顶车库以及我们此行主要目标——无人驾驶汽车的停车场。这里有好几种无人驾驶汽车,包括你在公路上最有可能看到的雷克萨斯车型,已经退休的普锐斯,以及新的克莱斯勒Pacifica。
无人驾驶汽车很容易被分辨出来,因为它们全身布满传感器。其中最突出的是在汽车顶部的激光扫描仪(通常称为LIDARs)。但克莱斯勒Pacifica的侧视镜附近,也有尺寸较小的旋转LIDARs。它们的后面还有雷达,看起来就像史瑞克令人不安的白色耳朵。
当汽车的传感器投入使用时,即使是在停车的时候,旋转的LIDARs也会发出奇怪的声音。它介于哀嚎和重击声之间,仅仅因为它是如此的新奇,以至于我的耳朵无法像往常那样自动过滤掉汽车发出的常见声音。在主楼对面的街道上,停着一辆比较特别的汽车。它全身被印有X标识的不同尺寸红色胶带缠住,那是四级车的标志。
对无人驾驶汽车自主化程度的分级是汽车工程师协会(Society of Automotive Engineers)制定的。我们在公路上看到的大部分汽车都属于一级或二级汽车,这意味着它们可以在高速公路上进行智能巡航控制。但是红色的X汽车则完全不同,它不仅是完全自动化的,而且无法被人在内部驱动,所以Waymo不想把它和其他汽车混在一起。
当我们驶进停车场时,不禁产生“曼哈顿计划”的印象,这里是科技初创公司的前沿。在主楼中一个教室大小的房间里,我看到了这个神奇地方的背后原动力——斯蒂芬·维勒格斯(Steph Villegas)。维勒格斯穿着一件长长的、非常合身的白色圆领衬衫、乞丐牛仔裤、灰色针织运动鞋,依然像她加盟谷歌前在旧金山精品时装店Azalea工作时那样时尚。维勒格斯在加州伯克利附近的东湾郊区长大,并在加州大学伯克利分校学习美术,2011年加入谷歌无人驾驶汽车项目。
我问道:“你是司机吗?”维勒格斯回答说:“我永远都是司机。”她在101号和280号高速公路之间花了无数时间,这些高速公路通往旧金山和山景城。就像其他司机那样,她开始对在开放道路上行驶的汽车产生一种感觉,这在无人驾驶计划中被认为非常重要,因为他们对汽车可能会遇到哪些困难有非常敏锐的直觉。维勒格斯告诉我:“在更新的软件上做些测试,在团队中待久后,我开始思考挑战现有系统的方法。”
为此,维勒格斯和部分工程师开始准备进行尝试,以期找到可控的方式测试新的行为。他们开始霸占Shoreline Amphitheater停车场,所有入口都安排人,以确保只有经过批准的谷歌人才能进入。维勒格斯说:“这就是我们开始的地方,我和几个司机每周都去尝试。我们会想出一组我们想要测试的东西,在卡车里装满补给,然后把卡车开到停车场进行测试。”
这些成为无人驾驶项目的第一个结构化测试。事实证明,最困难的部分其实并不是人们想象的那种“僵尸末日”的场景,而是像人类司机那样在正常交通中体验无尽的变化。维勒格斯开始从她能找到的任何地方收集道具:假人、圆锥体、假植物、儿童玩具、滑板、三轮车、洋娃娃、球以及其他小玩意儿,并将它们全部收进了道具箱。这些道具先是被储存在帐篷里,然后是城堡里,现在有了完整的储藏室。
图4:城堡中的“道具车库”
但这个过程也出现很多问题。他们想要将车开得更快,并使用街灯和停车标志。而Shoreline Amphitheater经常举办演唱会也常常会打乱他们的计划。为此他们需要一个基地,一个秘密基地。这就是城堡所能提供的。他们签了租约,开始建造自己梦想中的虚假城市。维勒格斯说:“我们决定设计住宅街道、高速公路、死胡同、停车场等基础设施,所以我们就像在真实城市中开车一样。”
我们从主拖车办公室步行到她的汽车旁。当我们即将离开时,她递给我一张地图,并说:“就像在迪斯尼乐园一样,你可以沿着地图走。”地图也是精心绘制的。在一个角落里,有个维加斯风格的牌子,上面写着:“欢迎来到加利福尼亚的神话城堡。”园区的不同部分甚至有自己的命名习惯。在我们正在穿越的那块地方,每条路都是以名车命名的。
我们穿过几栋粉红色的建筑,它们是旧的军用宿舍,其中一个已经被改造过了。当Waymo员工无法回到湾区时,他们可以在这里休息。除此之外,测试区域内再没有其他建筑物,它确实是一个机器人汽车的城市。
图5:城堡中的“邻居”
作为局外人,这里给人的感觉就像一个没有玩家的视频游戏场景。从林荫大道到邻近社区的街道,从水泥车道到郊区十字路口,再减去我们与这些地方联系的建筑,这一切都显得令人不可思议。我不断地瞥见自己走过的路,最后停在巨大的双车道环形路上。在中间,有一圈白色栅栏。维勒格斯说:“我们在德克萨斯州奥斯丁曾遇到多车道环形路口,然后在这里特别安装了这种环状交叉路口。最初这里只有单车道的环形路口,后来出现多车道路口,它看起来就像不同颜色的马,感谢得克萨斯提供的灵感。”
图6:双车道环形路口
当维勒格斯盯着新增设设施——沿着与草皮比邻的平行停车场修建的两条车道和一条自行车道时,我们停了下来。她说:“我真的很喜欢沿着平行停车场建设新的设施,类似的场景已经出现在商业区的郊区,比如核桃溪市、山景城以及帕罗奥图等。人们从店面或公园出来,在汽车之间行走,也可以提着东西穿过马路。”这条小路很像维勒格斯记忆中的碎片,特别是嵌入沥青和混凝土中的记忆,这将会变成更抽象的形式,帮助机器人汽车改进适应家庭地形的能力。
维勒格斯开车送我回到主办公室,我们跳上了一辆无人驾驶汽车,它由Chrysler Pacificas改装。我们的“左侧座位”司机是布兰登·凯恩(Brandon Cain),他通过笔记本电脑上的XView软件跟踪汽车的表现。还有其他测试助理,他们被称为“狐狸”,是由“人造”这个词演变而来的。他们驾驶汽车、创造交通、像行人那样行动、骑自行车以及举着停车标志。他们或多或少可以被称之为演员,而他们的观众是汽车。
我们要做的第一个测试是“简单的超车和并道”,只是需要在高速条件下完成,时速约为72公里。我们在名为Autobahn的宽阔公路上直行。当有“狐狸”将我们拦住时,Waymo汽车会刹车,然后团队开始关键数据点,即减速过程。他们正试图创造出一种场景,让汽车能够及时刹车。这有多难?这就像让光停下来,阻止我的腋窝出汗,或让手机掉落地板的过程停下来那样。
让我说些可笑的事情:这不是我第一次驾驶无人驾驶汽车。过去,我选择了两种不同的无人驾驶方式:第一次我驾驶雷克萨斯越野车穿过了山景城的街道,第二次驾驶谷歌Firefly在谷歌屋顶上“跳舞”。它们都是不起眼的游乐设施,但这次是不同的。这次涉及两辆快速移动的汽车,其中一辆被需要以Waymo团队所谓的“辛辣”方式停下来。
测试开始了,凯恩发动汽车,并小声下令进入“自动驾驶”模式。另一辆车接近我们,并试图阻隔我们。我们的车刹车了,又快又稳,这给我留下了深刻印象。随后,凯恩等人检查减速数字,并意识到我们的刹车做得还不够好。我们必须再做一次,一次又一次地重复。另一辆汽车则利用不同的方式、从不同的角度阻挡我们,他们称这种测试为“覆盖”。
图7:两辆汽车高速行驶并道,其中1辆属于无人驾驶汽车
我们经历了另外三个测试:高速并道,遇到在车道上后退的汽车,而第三个则是以无人驾驶汽车的视线为主,当行人将篮球扔到道路上时,汽车平稳地减速刹车停下。每个测试都以自己的方式给人留下深刻的印象,但其中阻挡测试最让我震惊。
当我们决定继续体验无人驾驶时,凯恩改变了座位。他问我:“你看过《Pacific Rim》吗?”那是吉列尔莫·德尔·托罗(Guillermo del Toro)的电影,里面的人通过与巨大的机器人同步来与怪物战斗。他说:“我试着和车保持同步,我们分享一些想法。”
我希望凯恩能够解释下“与汽车同步”到底什么意思。他说:“我正努力调整汽车中人们的体重差异。我经常待在车里,能感觉到车在做什么。这听起来很奇怪,但我的确能用臀部感受到,我知道它想做什么。”
远离尘雾缭绕的城堡,来到山景城舒适的谷歌总部。我来拜访Waymo的工程师,从技术角度来看,他们隶属于X部门,即谷歌长期、高风险研究部门。2015年,当谷歌重组为控股公司Alphabet时,Google X中的“Google”被从其名称中删除。在重组后的一年里,X和Alphabet决定将无人驾驶汽车项目分拆,成立独立公司,就像谷歌此前的其他项目也成为独立业务那样。
Waymo就像谷歌的孩子,它的办公室仍然位于母舰内部。尽管这个部门由两个小团体组成,但他们正慢慢融合成为整体。X/Waymo大楼很大,通风良好,还挂着Project Wing的无人机原型。在这里,我抓住了该公司研发Firefly汽车的线索。 从自助餐厅出来,你就可以看到Waymo的模拟集群。在这里,每个人的屏幕上似乎都有Carcraft和XView,黑色背景的多边形比比皆是。这些人创造了Waymo汽车通过的虚拟世界。
图8:当四个人推着一辆汽车时,Waymo汽车的激光扫描仪会显示什么
等待我的人是Carcraft的创造者詹姆斯·斯托特(James Stout)。他从来没有公开谈论过他的项目,但其热情从未消退,Carcraft就像他的孩子。他说:“我当时正浏览招聘信息,看到无人驾驶汽车团队正在招人。我简直不敢相信他们竟然在招人。”斯托特成功进入这个团队,并立即开始开发这个工具,现在它支持着无人驾驶汽车每天在虚拟世界中行驶。
当时,他们主要用这个工具来观察汽车在棘手情况下下会做些什么。而在此前类似情况下,人类司机已经控制了汽车,他们开始进行各种假设。斯托特说:“很明显,这是一件非常有用的事情,我们可以在这方面做很多事情。”Carcraft的空间范围不断扩大,甚至囊括整个城市,虚拟汽车的数量也不断增加。
斯托特找来埃琳娜·科拉洛夫(Elena Kolarov),她是被称为“情景维护”团队的负责人,负责管理控制。她面前有两个屏幕。左边屏幕运行XView,显示汽车“看到”的东西。这辆车使用了摄像头、雷达和激光扫描来识别其视野中的物体。这些物体在软件中用简洁的线框形状代表,非常易认。物体形状上延伸出来的绿色线条代表着其可能的移动方式。在底部,有一个图像条显示汽车上常规摄像头捕捉到的场景。科拉洛夫还可以打开激光扫描仪传回的数据,这些数据以橙色和紫色的点显示出来。
我们在城堡的环形交叉路口看到了真实并道场景的回放。科拉洛夫转换为模拟版本,它们看起来几乎没有差别,但它不再是数据日志,而是汽车必须解决的新情况。唯一不同的是,在XView屏幕的顶部,它用大红字母显示着“模拟”。斯托特说,他们必须给予补充说明,因为人们很难分清模拟与现实的区别。
图9:在XView模拟中看到的Castle环形路口
他们加载了另一个场景,这次是在凤凰城。科拉洛夫放大了模拟,显示这是一座城市。斯托特说,里面有各种各样的车道,还有车道之间的连接情况、停车标志是、交通灯位置、限行区、车道中心位置等,有你需要知道的一切。
图10:Waymo的汽车模型行驶在虚拟的钱德勒市,它位于亚利桑那州凤凰城附近
我们在凤凰城附近的某个地方放大了4车道路口。然后,科拉洛夫开始投放人工合成的汽车、行人以及自行车。
图11:在Carcraft中创建的合成场景
点击热键,屏幕上的物体就开始移动。汽车就像汽车那样移动,在车道上行驶,转弯。骑自行车的人就像真正骑自行车的人。在无人驾驶汽车团队操纵无人驾驶汽车在现实世界行驶了数百万公里后,他们的逻辑已经形成固定模式。在这一切的背后,有一份关于世界的超详细地图,以及在现场的不同物理模型,橡胶和道路都被建模。
图12:正在Xview中模拟的场景
无需感到奇怪,最难模拟的实际上是其他人的行为。Waymo的软件主管德米特里·多尔戈夫(Dmitri Dolgov)告诉我:“我们的车看到了世界,也了解世界。然后,对于任何在环境中扮演动态角色的物体来说,无论是汽车、行人、骑单车者还是摩托车,我们的车都能理解它们的意图。仅仅追踪某个物体通过某个空间还不够,你必须明白它在做什么。这是建造有能力的、安全的无人驾驶汽车的关键。这种建模,这种对世界上其他参与者的行为的理解,与这个任务中模拟它们非常相似。”
有一个关键的区别:在现实世界中,他们必须接受关于环境的新鲜实时数据,并将其转化为对场景的理解,然后进行导航。但现在,经过多年的研究,斯托特等人相信自己能做到这一点,因为他们已经运行了“一系列的测试”,并证明他们能识别各种各样的行人。
因此,在大多数模拟中,他们跳过了对象识别步骤,没有给汽车提供识别行人的原始数据,而是直接告诉汽车,这些都是行人。在路口,科拉洛夫为无人驾驶汽车甚至更多困难。她点击了V,这是车辆的一个热键,一个新对象出现在Carcraft中。然后她把鼠标移到右手边的下拉菜单上,那里有很多不同的车型,包括我最喜欢的bird_squirrel。
不同的对象被告知需要遵循Waymo为它们建模的逻辑,需要在Carcraft构建的场景中以精确的方式移动,以测试特定的行为。斯托特说:“有个很好的光谱,可以控制一个场景,然后把对象放进去,并让它们离开。”一旦它们具备了场景的基本结构,他们就可以测试它所包含的所有重要变量。所以,想象一下,对于路口来说,你可能想要测试各种车辆、行人以及骑单车者的到达时间,他们停下来的时间,他们移动的速度,以及其他任何东西。”
他们称这种模式为“fuzzing”。在这种情况下,这个路口可产生800种可能的情况。它创造出美丽的花边图表,工程师可以进去看看,不同变量的组合如何改变了汽车采取路径的决定。
图13:Carcraft的“fuzzing”图表
这个问题真的变成了分析所有这些场景和模拟,以找到可以指导工程师更好地驾驶的有趣数据。第一步可能是:汽车会被撞吗?如果确实如此,那将是一个有趣的场景。下图就显示了这种情况。在山景城的现实生活中,路口的场景更为复杂。当车子向左行驶时,一辆自行车靠近了,导致汽车停在路上。
工程师们解决了这类问题,并重新设计了软件进行纠正。图中显示的是真实情况,然后再模拟运行。这意味着两种不同的情况,你会看到模拟汽车继续行驶,然后写着“shadow_vehicle_pose”的虚线框出现。这个虚线框显示了现实生活中发生的场景。对Waymo团队来说,这是最清晰的可视化进展。
图14:Waymo模拟显示车辆导航系统的改进
但他们不只是在寻找汽车被撞时的细节。他们可能还想要在正确范围之外寻找太长时间的决策或刹车反应迟缓的影响。如果工程师想要从中吸取教训,他们将通过模拟寻找问题。斯托特和Waymo软件主管多尔戈夫强调,模拟有三个核心方面。第一,他们驾驶的里程数远远超过现实世界中的物理车队,而且获得更多更好的经验。第二,这些汽车专注于有趣且仍然互动困难的里程,而不会关注无聊的里程。第三,软件的开发周期可以更快。
多尔戈夫表示:“这个迭代周期对我们非常重要,我们在模拟过程中所做的所有工作都允许我们戏剧性地减少时间。在项目的最初阶段,这个周期可能需要好几个星期,而现在只需要几分钟的时间。”我继续问他,路上的油片或者是爆胎、怪鸟、天坑以及其他令人疯狂的事情,他们都能模拟吗?多尔戈夫对此很乐观,称已经可以模拟,但是关键在于这些模拟的逼真度有多高?也许有些问题你得到了更好的价值,或者通过运行一系列测试得在模拟中确认物理世界中的场景。
Carcraft虚拟世界的力量并不在于它们是真实世界的美丽、完美、逼真效果图,而是在于他们以多种方式反映出了现实世界,这对无人驾驶汽车来说是非常重要的,它能比物理测试多获得数十亿公里的里程。对于运行在模拟中的驱动软件,尽管它的决定方式与现实世界不同,但却与在现实世界中做出的决定相同。
这种方法是有效的。加州机动车管理局要求公司报告他们每年无人驾驶的里程,以及脱离司机进行的自动测试。Waymo不仅行驶里程比其他任何人都要多出3个数量级,它们人类司机干预的数量也在快速下降。从2015年12月到2016年11月间,Waymo汽车以无人驾驶模式行驶了102万公里。在所有里程中,司机只参与了124次,平均每8000公里1次。而在此前1年,这些汽车自动行驶了68万公里,但人类司机干预了272次,平均1432公里1次。
虽然每个人都煞费苦心地注意到,这些并不是“苹果与苹果”之间进行的同类数字对比,但让我们来看看现实:这些都是我们得到的最好比较,至少在加州是这样的,其他车辆总共以自动驾驶模式行驶了大约3.2万公里。Waymo所采取的策略对于外部专家来说并不奇怪。风险投资公司Andreessen Horowitz的投资主管克里斯·迪克森(Chris Dixon)说:“现在,你几乎可以通过对待模拟的认真程度,衡量某个无人驾驶团队的成熟程度。Waymo处于最顶端的位置,也是最成熟的。”
我问Allstate Insurance保险公司的创新主管苏尼尔(Sunil Chintakindi)关于Waymo项目的看法,他说:“如果没有强大的模拟基础设施,就无法构建(更高级别的)自动化车辆。”其他无人驾驶汽车的研究人员也在寻找类似的路径。密歇根大学自动与联网汽车实验室Mcity主任彭晖(Huei Peng)说,任何用于无人驾驶汽车的系统都将是“99%以上的模拟+精心设计的结构化测试+公路测试。”
彭晖和一名研究生提出了一套系统,可以通过模拟来加速测试,这与Waymo的执行方式没什么不同。彭晖说:“所以我们争论的是只是把开车的无聊部分切断,专注于有趣的部分。这可以让你加速数百倍,1000公里变成数百万公里。”
令人惊讶的是Waymo项目的规模、组织和强度。我向彭晖描述了谷歌所进行的结构化测试,包括Castle结构化测试团队设计的20000个模拟场景。但他听错了,并说:“这2000个场景让人印象深刻。”当我插话并纠正他时,他回答说:“确实如此,20000个场景。那的确让人印象深刻。”实际上,2万个场景仅代表Waymo所测试全部场景的一小部分。它们都是由结构化测试创建的,还有更多场景来自于公共驾驶和想象。彭晖说:“他们做得真的很棒,他们在四级车领域面遥遥领先于其他所有人。”
但彭晖也强调了传统汽车制造商的立场。他说,他们正在尝试做一些截然不同的事情,而不是瞄准完全自动化的“moon shot(疯狂而难以实现的项目)”,他们试图增加司机辅助技术,“赚点钱”,然后逐步走向完全自动化。与Waymo进行对比不公平,它有丰富的资源,在一辆车上安装了7万美元的激光测距仪,而像雪佛兰这样的汽车制造商可能会看到,4万美元可能已经是大众市场采用的价格上限。
彭晖表示:“通用、福特、丰田和其他汽车公司都在说:‘让我减少车祸和死亡人数,增加大众市场的安全性。’它们与Waymo的目标完全不同,我们需要考虑数百万辆汽车,而不仅仅是几千辆。”即使是在完全自动化的竞赛中,Waymo现在也比过去有更多挑战者,尤其是特斯拉。
18个月前,斯坦福大学汽车研究中心主任克里斯·格迪斯(Chris Gerdes)曾说过,Waymo对问题的深度有更深入的了解。与其他人相比,我们更接近解决问题的方案。当我上周问他是否还如此认为时,他说:“很多事情都改变了。福特和通用汽车等汽车制造商已经在开发自己的汽车,并建立了公路数据集。特斯拉现在已经通过部署Autopilot收集了大量数据,了解系统是如何在其客户体验条件下运作的。他们能够在静默模式下测试算法,并快速扩展测试车辆数量,这让它们成为惊人的试验台。
在模拟领域里,格迪斯说:“我看到了很多有实质性项目的竞争者。我确信有相当多的模拟能力,但我已经看到许多看起来值得信赖的东西。在这方面,Waymo看起来不再那么独特了。他们当然起步很早,但现在有很多团体都在利用类似的方法。所以现在最重要的问题是谁能做到最好。”
这不是神经网络“大脑式”能力的低风险演示,而是在人工智能领域取得的巨大飞跃,甚至对Alphabet内部公司来说也是如此,后者在采用人工智能方面始终很积极。这不是Google Photos,如果在这里犯错后果还不算太严重。而对于在人类世界里积极互动全自动系统,它将理解我们的规则,传达它的渴望,让我们的眼睛看到。
Waymo似乎想把驾驶作为一种技能,速度和方向都是其中的一部分。他们现在正将驾驶融入到人类社会活动中,通常情况下,如何驾驶才算“合法”?人类如何教人工智能其所代表的含义?事实证明,研发这种人工智能并不仅仅需要无穷无尽的数据和工程技术。这些都是必要的,但还不够。相反,开发这个人工智能要求人类与汽车同步,了解世界。尽管任何人都能做到,但在城堡里的司机们都知道,作为一辆汽车,要像人类那样观察和做出决定。也许这也有两种方式:人类对汽车的了解越深,汽车对人类的理解也就越深。
奥斯汀环形路口的记忆变成了城堡的一部分,变成了无人驾驶汽车的数据日志,变成了Carcraft中的场景,变成了模拟网络,最终重新回到了德克萨斯州无人驾驶汽车的新软件中。即使在模拟中AI用来了解世界的多边形抽象图,也有人类梦的痕迹、回忆的片段、司机的感觉。这些要素不是错误,也不是人类的污点,而是那些可以彻底改变交通、城市和其他一切的系统的必要组成部分。