人工智能(AI)时代已经来临,这项技术其实从90年代开始就不断走向成熟。现如今,阿尔法狗(AlphaGo)又轻松击败了人类最强围棋大脑,顶尖电竞团队打Dota也败给了AI,并且永远不可能再翻盘。自动驾驶可以说是人工智能应用最大、最典型的场景,然而为何自动驾驶汽车的发展却一波三折。『清华大学车辆与运载学院长聘副教授李升波』
日前,在第六届国际智能网联汽车技术年会(CICV 2019)上,清华大学车辆与运载学院长聘副教授李升波称,一个AI算法应用在手机上其实是比较比较容易实现的,但是应用在汽车上,一旦把安全性、节能性、流畅性以及舒适性等要求加上去,这个挑战就已经是成倍的增长了。 自动驾驶汽车的现实如何,又面临哪些实际问题呢?李升波从自动驾驶汽车“感知”、“决策”和“执行”三个层面剖析了自动驾驶发展所面临的挑战。 感知层的挑战 感知层,其实是要解决汽车“我在哪里”的问题。目前,一般采用摄像头、毫米波雷达、激光雷达、GPS、IMU(惯性测量单元)等来实现。摄像头是当前应用人工智能算法的核心零部件,摄像头主要有四大任务:图像分类、目标的定位、目标的检测和语义分割。 李升波称,目前所采用的主流方法是深度学习神经网络来完成上述任务,理论上没有问题,但在实际应用中问题比较大。一方面,当汽车需要去识别更多的车辆、行人、自行车以及道路标志等目标的时候,无论是人工智能的训练深度还是推断能力都有所欠缺。例如,神经网络需要大量的数据标注,1500万张图片需要5万多名工程师耗费2年时间才能完成,但这才标注了20多种类型,而道路环境需求却远超这个数据。这还不包括激光雷达、毫米波雷达等传感器所需要标注的数据,况且除了数据标注工作外,还要加上安全性和准确性等方面的要求。 此外,实际驾驶场景中还有恶意样本的欺骗性。李升波举例称,原来是熊猫的样本图片中加入百分之一的“噪声”,系统就将其识别成了金丝猴。而这样的“噪声”干扰在现实中太多了,神经网络在对抗恶意样本的时候能力会变得非常脆弱。 决策层的挑战 决策,在狭义上其实是指自动驾驶的“大脑”根据汽车“看到”的环境信息,给出汽车的驾驶策略。目前,在园区等简单的封闭场景下,自动驾驶系统决策比较“完美”,但在城市工况下却不尽然。 李升波例举了一个颇具现实意味的例子,检验自动驾驶汽车决策是否完美最直接的方式就是,“让一辆自动驾驶汽车从清华大学校门口跑到五道口,如果不出问题,那就算过关了,这是最好的测试场景。” 不过,自动驾驶汽车在现实中很难通过十字路口,这就需要更加先进的人工智能决策和控制系统。李升波称,现今在“干净”的场景下做决策没问题,但是像中国道路状况的复杂性就太高了,行人的随机性太强,还有碰瓷的问题又该如何解决呢。 另外一类是跟驾驶员相关,98%的驾驶员在驾车时其驾驶行为集中在4中模式:急行、超车、跟车、换道。但从研究的角度来说,驾驶行为有几百种,虽然前面4中驾驶模式覆盖了所有驾驶行为的98%,但剩下的2%却同样跟安全密切相关。李升波称,人在驾驶时是不断改进的,但当前决策模块却达不到这样的水平。可以看出,人工智能还需要不断进化才能应用在汽车领域。 执行层的挑战 排在感知、决策之后,就是执行的问题,也就是汽车的运动问题。狭义上来说,自动驾驶汽车需要解决方向盘(转向)、油门/刹车(制动)两个问题,能够实现纵向和横向的同时控制,这也就基本达到了L3级自动驾驶(L3与L2最根本的区别在于L3实现了纵向和横向的控制)。 不过,李升波同样认为当前汽车运动也不“完美”。一方面是,传感器有“噪声”、执行器有误差、变速车轮非线形。在普通的路况较好的道路上运动控制是没有问题的,但是在极限状态下还达不到。 另外,如果自动驾驶要实现商业化,卡车编队控制是一个重要的商业化应用场景。而在卡车编队中,有时候为了节能有时候需要把卡车间的距离控制在4-5米,而这种精度的运动控制已经上升了一个量级。