人工智能领域简报 2018年第25期自动驾驶技术遭遇瓶颈

从表面上看，今天似乎比以往任何时候都更接近完全自动驾驶。

2015年，埃隆·马斯克预测到2018年，会有完全自动驾驶的特斯拉;谷歌也是如此。 Delphi和MobileEye的4级系统目前定于2019年，同年Nutonomy计划在新加坡街头部署数千辆无人驾驶出租车。通用汽车将在2019年使完全自动驾驶汽车投产，没有方向盘或司机介入。这些预测背后有实实在在的资金支撑，押注软件能够赶上炒作的假设。

Waymo已经在亚利桑那州有限的公共道路上测试汽车。特斯拉和许多其他模仿者已经出售了有限形式的自动驾驶仪Autopilot，如果发生任何意外情况，司机就会进行干预。发生过一些事故，有些是致命的车祸，但只要系统不断改进，逻辑是，在需要干预的情况我们不必等太久。

但实现完全自动驾驶汽车的梦想可能比我们意识到的更远。人工智能专家越来越担心，在自动驾驶系统能够可靠地避免事故之前，可能需要数年甚至数十年。随着自我训练的系统应对现实世界的混乱，像纽约大学的加里·马库斯这样的专家正准备在预期中进行痛苦的重新校准，这种纠正有时被称为“人工智能寒冬”。这种延迟可能会给那些依靠自驾车技术的公司带来灾难性后果，让整整一代人无法获得完全的自动驾驶。

很容易理解为什么汽车公司对自动驾驶态度乐观。在过去十年中，深度学习 —— 一种使用分层机器学习算法从海量数据集中提取结构化信息的方法 —— 已经在人工智能和技术行业中取得了几乎无法想象的进展。它支持谷歌搜索，Facebook新闻流，会话式语音到文本算法以及围棋冠军Go-playing系统。在互联网之外，我们使用深度学习来检测地震，预测心脏病，并标记摄像头上的可疑行为，以及无数其他本来不可能的创新。

但深度学习需要大量的训练数据才能正常工作，几乎包含算法将遇到的每个场景。例如，Google Images等系统非常善于识别动物，只要有训练数据来向它们展示每种动物的样子。马库斯将这种任务描述为“插值”，对所有标记为“豹猫”的图像进行调查，并确定新图片是否属于该组。

工程师可以在数据来自何处以及如何构建数据时获得创造性，但对给定算法可达到的范围设置了严格的限制。相同的算法无法识别豹猫，除非它看到成千上万的豹猫的照片 —— 即使它看到了家猫和美洲虎的照片，并且知道豹猫介于两者之间。这个过程称为“概括”，需要一套不同的技能。

长期以来，研究人员认为他们可以通过正确的算法提高泛化技能，但最近的研究表明，传统的深度学习在概括时比我们想象的更糟糕。一项研究发现，传统的深度学习系统甚至难以在视频的不同帧上进行概括，根据背景中的微小变化将同一北极熊标记为狒狒、猫鼬或黄鼠狼。由于每个分类基于数百个因素的总和，即使是图片的微小变化也可以完全改变系统的判断，其他研究人员充分利用对抗数据集。

马库斯指出聊天机器人热潮是最近炒作泛化问题的例子。 “我们在2015年就承诺推出聊天机器人。”他说，“但它们没有任何好处，因为它不仅仅是收集数据的问题。”当你在网上与一个人交谈时，你不仅仅想要他们重新讨论早期的对话。你希望他们能回应你所说的话，利用更广泛的会话技巧来产生对你独有的回应。深度学习无法制作那种聊天机器人。一旦最初的炒作消退，公司就对他们的聊天机器人项目失去了信心，而且几乎没有人在积极开发中。

这让特斯拉和其他自动驾驶公司面临一个可怕的问题：自动驾驶汽车会越来越好，比如图像搜索、语音识别，以及其他人工智能的成功故事吗?还是会遇到像聊天机器人这样的泛化问题?自动驾驶是插值问题还是泛化问题?驾驶真是难以预测吗?

现在可能还为时过早。 “无人驾驶汽车就像一个我们不知道答案的科学实验。”马库斯说。我们以前从未有过这个级别的自动驾驶，所以我们不知道它是什么类型的任务。在某种程度上，它是关于识别熟悉的对象和遵循规则，现有技术应该完成任务。但马库斯担心，在事故多发的情况下驾驶可能比行业想承认的要复杂得多。 “在某种程度上，令人惊讶的新事物发生了，这对于深度学习来说并不是一件好事。”

我们获得的实验数据来自公共事故报告，每个报告都提供了一些不寻常的问题。在2016年，一场致命的车祸导致Model S车辆全速撞上白色拖拉机拖车的尾部，由于拖车的底盘高度很高，加上刺眼阳光的反射而混淆。 3月份，Uber一辆无人驾驶测试车撞死一名女性，当时是在晚上，这名女性推着自行车突然出现在人行横道。根据美国国家运输安全委员会的报告，每次更新其预测，Uber的软件错误地将该女性识别为一个未知物体，然后是一辆车，最后才是一辆自行车。在加利福尼亚州的一次撞车事故中，由于仍不清楚的原因，Model X在撞击之前转向障碍并加速。

每次事故似乎都是一个极端案例，工程师无法提前做出预测。但几乎所有的车祸都涉及某种不可预见的情况，如果没有一般的推广能力，自动驾驶汽车将不得不面对这些情景中的每一个，就好像这是第一次。结果将是一连串的侥幸事故，随着时间的推移，这些事故不会变得不那么常见或者不那么危险。

Drive.AI创始人吴恩达是前百度高管，也是该行业最著名的拥护者之一，他认为，与培训旁观者预测自驾车行为相比，问题不在于建立一个完美的驾驶系统。换句话说，我们可以为汽车提供安全的道路，而不是相反。作为一个不可预测的案例，采访中问及是否认为现代系统可以处理玩弹簧单高跷的行人，即使它们以前从未见过。 “我认为许多AV团队可以在人行横道上处理踩着弹簧单高跷的行人。” 吴恩达表示，“话虽如此，但在高速公路中间玩弹弹簧单高跷是非常危险的。”

“我们应该与政府合作，要求人们守法和体谅，而不是建立人工智能来解决弹簧单高跷的问题。”吴恩达说，“安全不仅仅与人工智能技术的质量有关。”

深度学习不是唯一的人工智能技术，公司已经在探索替代方案。虽然技术在行业中受到严密保护(仅仅看看Waymo最近针对Uber的诉讼)，但许多公司已经转向基于规则的AI，这是一种较老的技术，可以让工程师将特定的行为或逻辑硬编码到另外的自导系统中。它不具备通过研究数据来编写自己的行为的能力，而这正是深度学习如此令人兴奋的原因，但它会让公司避免一些深度学习的局限性。但由于深度学习技术仍然深刻地影响了感知的基本任务，因此很难说工程师如何成功隔离潜在的错误。

作为Lyft董事会成员的风险资本家Ann Miura-Ko认为，问题的一部分是对自动驾驶汽车本身的高度期望，将任何未达到完全自动驾驶的事情归类为失败。 “期望它们从0跳到5级是预期的不匹配，而不是技术的失败。” Miura-Ko表示，“我认为所有这些微观改进都是实现完全自动驾驶的非凡之处。”

不过，目前还不清楚自动驾驶汽车可以在自动情况下保持多长时间。像特斯拉的自动驾驶仪Autopilot这样的半自动产品足够智能，可以处理大多数情况，但如果发生任何过于不可预测的事情，还是需要人为干预。当出现问题时，很难知道汽车或司机是否应该受到责备。对于一些评论家来说，即使错误很难完全归咎于机器，这种人机混合可能比人类驾驶员更不安全。兰德公司的一项研究估计，自动驾驶汽车必须在没有死亡事故下行驶2.75亿英里，才能证明它们和人类驾驶员一样安全。与特斯拉自动驾驶仪相关的首次死亡事件发生在大约1.3亿英里的范围内，远远低于标准。

但是，通过深入学习，汽车如何看待物体并做决定应对，提高事故率可能比看起来更难。 “这不是一个被孤立的问题。”杜克大学教授玛丽·卡明斯(Mary Cummings)表示，他指的是今年早些时候发生的Uber事故导致一名行人遇难。 “感知-决策周期通常是联系在一起的，就像撞死行人的事故一样。基于感知的模糊性做出了决定，并且紧急制动被关闭，因为它从传感器得到太多的错误警报。”

致命车祸事故促使Uber暂停了今年夏季的自动驾驶测试工作，这对计划进行测试的其他公司来说是一个不祥之兆。在整个行业中，公司正在竞相争取更多数据来解决问题，假设拥有最多里程的公司将构建最强大的系统。但在公司看到数据问题的地方，马库斯看到了更难解决的问题。 “他们只是使用他们所拥有的技术，希望它能起作用。”马库斯说，“他们依靠大数据，因为这是他们拥有的拐杖，但没有任何证据表明达到我们所需的精确度。”

人工智能领域简报 2018年第25期 自动驾驶技术遭遇瓶颈

人工智能领域简报 2018年第25期自动驾驶技术遭遇瓶颈