编者按:2022年5月6日,由盖世汽车与慕尼黑上海电子展联合主办,武汉东湖新技术开发区特别支持的2022第五届自动驾驶与人机共驾云论坛如期举行,逾6.4万人次的观众在线参与。其中涉及相关政企人士、高校学者、科研机构专家、厂商代表等,一同在“云端”探寻自动驾驶发展之路。
上海智驾汽车科技有限公司(智驾科技MAXIEYE)创始人&CEO周圣砚进行了主题演讲,盖世汽车整理成文以飨读者。在周圣砚的带领下,MAXIEYE实现了中国智能驾驶系统规模化量产,客户覆盖商用车和乘用车领域数十个品牌车型,在国内率先实现从感知到规控全栈L2技术开发。
规模化L2自动驾驶系统是智能驾驶向上突围的支点。其中有两个关键词,一个是规模化,另一个是L2。
目前在公路圈上面可以量产的最高驾驶级别是L2,其中由国内自主开发的智能驾驶系统只占到整个市场的不到3%。不过2021年下半年,由国内主导的L2产品已经开始逐渐进入量产阶段,所以“不到3%”的数量里面,也证明了,确实有一些企业,在5年左右的时间内,完成了国外需要十几年才能完成的技术积累。因此,周圣砚认为,只要国内公司能够保持速度,抓住机遇,本土品牌就能够抓住智能驾驶向上突围的支点。
十年踪迹 本土品牌的机会与挑战
遥想2025年,国内自动驾驶行业取得了蓬勃的发展,站到世界第一梯队,成为了这项技术世界主流的提供商。周圣砚将其前后五年分为了两个部分。 第一个五年将它称之为呼吁量产,第二个五年叫做关注体验。
呼吁量产阶段,各行各业都冲入了自动驾驶赛道,从出身而言,有互联网、手机、车厂等领域,也有来自象牙塔的高校派,还有一些甚至是博士刚毕业,带着实验室几个兄弟们,出来野心勃勃的希望杀出一条血路等等。
从技术方案来看,有主推GPU派的,有FPGA派的,有ASIC派的,还有工控机派的。从场景来看,有公路Robotaxi派,有Robotruck派,有渐进派(我们),当然也有扫地派,也有挖矿派,还有港口码头帮、机场送披萨派等等。各路豪杰好不热闹,大家都在用自己的故事和蓝图打动一批又一批投资人,挖掘一个又一个新的场景。中国自动驾驶的故事就是从那个时候开始的。因为我们所在的这个领域是和车厂共同打造规模化量产的产品给到C端。
时间到了2021年,我们看到了一个重点的变化,就是或多或少,有一些派系的(国内)玩家,冲出来了,用户开始逐渐不再只是青睐(Global)大厂品牌,而是已经进入到了更为关注体验的阶段。接下来的五年,需要从驾驶体验和成本这两个方面进行努力,这些是实现规模化的两个必要条件。
自动驾驶规模化L2有一席之地
自动驾驶技术要实现有最重要的三个部分:算法、算力和数据。
从算法的角度而言,MAXIEYE经历了三个阶段:传统机器视觉,深度学习和BEV架构。当然,这里把深度学习和BEV架构这样区分不是很严谨,这里主要是想强调基于像素级的深度学习框架和基于BEV全局视角下的深度学习框架这两者之间的代差。 使用不同算法的方式要求算力不一样,智驾科技第一代基于传统的视觉进行,下一代因为用深度学习,有几个T不等,做像素级算力的开发。到了下一个阶段,100个T,200个T可以很好的承载基于BEV这样框架的算法。
L2之所以是一个必争之地,是因为在此以上所有的功能都需要通过“迭代”的方式来进行开发,我们日常的L2覆盖了80%-90%的场景,越往上去开发会发现所能够遇到的情况越来越少,所以在开发阶段很难完成L3应用全功能的开发,这就有一个趋势产生了,叫边量产边开发。
举个例子,如果把一个L2的产品通过一种方式(堆算力、上域控),电路板,计算芯片比Ipad还大,成本也翻了好几倍,体验也就这样,最终会把成本转嫁给车厂,车厂可能就会转嫁给终端消费者,这就产生了自动驾驶的价值陷井。
但真正技术产品创新的意识是能够从少数人可享,普及到最广大的用户群体。所以在2022年会看到一个现象,无论是高端车还是低端车,都会逐渐开始装配L2的产品。做产品的公司不仅要关心客户,还要关心客户的客户,即终端用户。
客户是OEM,用户是C端,C端和OEM共同关心的三个点,OEM强调的是安全、增值和成本,对应到C端就是安全、舒适和预算。
如何评价一款好的L2-L3级别智能驾驶系统
MAXIEYE是一家为数不多的产品平台化可以横跨商用车,乘用车的公司,在这两个市场这么多年的时间积累感受来说,乘用车和商用车最大的区别在于,乘用车是生活资料,商用车是生产资料,生活资料大家理解,提供一种用来满足更高层次的物质,文化生活需求的消费品。因此,评价这类产品的优良属性体现为舒适,智能,便捷,包括人机体验这几个方面。好的产品所带来的体验是自传播效应的,类似于口碑营销。 商用车作为生产资料是一种工具,因此好的智能驾驶生产资料所追求的是安全、成本、经济效益和运营效益。
在平台化的开发过程中会考虑商用车和乘用车的两个共性。共性是SOC的选型,是MCU的选型,以及是基础算法的开发,比如说感知,规控算法等通用算法的开发。但我们在应用端的算法,比如说ACC,TJA的算法,在乘用车会更多考虑舒适性,在商用车更多考虑节油,但是安全都是底线。
从完整的智能驾驶系统评价体系来说MAXIEYE认为无论商用车还是乘用车共同关注的部分有两方面,安全和体验。
作为差异化的部分,乘用车更多注重场景体验的流畅度,比如说接管率,操纵的稳定性,个性化的风格的定制,比如说我们消费者可以选择更多的配置,低配覆盖的场景占80%-90%,越往高配它的边际效应会越不理想,比如说增加一倍的价钱,你的功能多了10%。
但是商用车更注重的是特殊车辆的场景功能,比如说重卡的盲区比较大,智驾科技MAXIEYE用两个视觉双V的方式来解决盲区近、中、远的问题,以及对节油的改善。所以一个好的商用车的智能驾驶系统,应该是一个很快时间,3年之内就要收回因为自动驾驶系统所增加的成本,甚至整车的生命周期让消费者最终可以实现盈利。
智驾科技MAXIEYE提供全栈自动驾驶服务
MAXIEYE定义的全栈是会影响到最终产品功能及体验所需要做出的全部努力,也就是说对于影响到客户交付和体验上的模块必须具备自研能力。所以MAXIEYE的全栈包括了感知、规划、决策和控制。
在全栈技术研发过程中,我们也发现了很多技术上的问题,从功能体验上而言,很难把感知和规控这两件事情割裂开,单一去定义到底是感知某一功能做的不好,还是控制做的不好。比如解决制动问题、目标车辆cut-in问题,感知和控制端都做了同时的努力,比如说解决目标车辆cut-in的减速问题,也是从感知和控制端都会进行影响,所以从全栈的思维解决问题会带给车厂很好的价值体验。
为给车厂一个很好的价值体验,MAXIEYE从技术纵深一步一步倒推,从最开始的控制到规划到感知,一直推到技术的源头去解决问题,从而赋能车厂。MAXIEYE在这里强调研发端是全栈自研,出发点是具备这样的能力在自动驾驶技术的开发过程中可以迅速找到制约功能实现的关键技术并加以解决,在销售端和市场端从业务的形态看,MAXIEYE既提供全栈系统(包括云端的OTA数据回传,也实现了全栈自研,都是一揽子做的),还有一部分模块的模块。,提供感知,融合和决策。
MAXIEYE基于全栈技术对商用车,乘用车进行了平台化的研发。平台化研发智驾科技聚焦于解决共性问题,其实这个共性问题占据了整个自动驾驶核心技术的90%,剩下的10%也就是最后一公里,标定也好,车辆本身的逻辑也好,MAXIEYE可以和客户共同解决。这是目前所服务的部分商用车和乘用车的客户,乘用车L2装配了两款车型,并且在今年和明年累计预计出货量20万台,都在L2以上。
L2规模化之后研判下一个技术增长点
MAXIEYE和所有自动驾驶企业一样,满怀着对深度学习的技术憧憬,抓住技术周期,呈现了L2产品所需要的要求目标的检测结果,跑在2T的算力芯片上。其实(在产品功能方面)很多公司没有什么太大的差异,但是在产品体验上,MAXIEYE背后做了很多的工作。
比如MAXIEYE用深度学习开发了坡度识别算法,坡度识别算法可以识别前方80米的道路的坡度,精确度到你用一个方程去拟合,会把整个车辆的三维的坡度曲线规划出来,为了能够将目标前后端进行关联,开发了专门的算法。为了能够将目标的速度提供一个接近毫米波雷达的精度,智驾科技也开发了多帧目标的RNN算法。
为了能够稳定的跟踪密集人流下穿梭的行人,MAXIEYE开发了基于行人的ARD算法,保证一个目标不跳变。为了保证140米的目标深度,MAXIEYE开发了3D预测,为了降低感知的误识别率,每个要素的检测都有两套不同维度的冗余算法做校验。不断用创新解决实际的工程问题过程中,我们在2020年就发现了深度学习的框架很快就会到一个技术边界。
智驾科技MAXIEYE从2020年开始认识到问题,需要打破技术边界,发现了BEV架构,2021年智驾科技已经开始了BEV的架构,简单来说它是上帝视角下端到端的思维,从技术要素的角度看,由于是上帝视角,因此输出的是具有实际物理意义的参数,目标距离与目标的速度,延续目标时间维度的表达是具备实际物理意义的表达,比如说一个向量,车辆和其他要素的相对运动学关系变成了可学习的规律要素,比如说可以做3D还原,这些东西使得MAXIEYE可以做很多的工作,将很多东西深度学习化,BEV就是构建这样的框架。MAXIEYE搭载BEV架构的乘用车将在今年年底可以实现量产,应该是最早的一批。
MAXIEYE理解的创新,其实是一直探索一些技术边界,并向上突破,这里面有微创新,有突破性创新,MAXIEYE将在创新中不断突破,砥砺前行。