8月26日,由盖世汽车主办的“2021行业首届智能汽车域控制器创新峰会”于上海汽车城瑞立酒店隆重召开。本次会议持续两天,将围绕智能汽车、智能驾驶域控制器、智能座舱域控制器、底盘及车身域控制器、智能驾驶计算平台、电子电器架构、软件定义汽车、车规芯片等行业焦点话题展开。会议期间,湖北芯擎科技有限公司产品规划管理部总经理蒋汉平发表了《7nm高性能智能车规芯片算力趋势分析 》的主题演讲。
湖北芯擎科技有限公司产品规划管理部总经理 蒋汉平
非常感谢有这样的机会跟大家聊一下我们芯擎公司,以及我们对高性能智能车规芯片算力趋势的分析,今天主要是作为本土的芯片公司向大家描述作为未来趋势的芯片,各方面的算力以及取舍的依据。
首先给大家介绍一下我们,我们公司是吉利旗下的ECarx和安谋中国共同出资成立的,注册地是湖北武汉,在北京、上海和武汉设有分支机构,目前有200多人,我们主要专注于SOC设计及系统实现。公司成立于2018年,开始运营是2019年,公司CEO是汪凯博士,在他的领导下集结了一批经验丰富、执行力高的业内精英,在此也热情邀请业界的芯片专家加入我司。
这是公司完整的生态系统,电子电气架构是依托于吉利,自动驾驶算法有ECARX,它深度的参与投资业界有号召力的算法公司;在神经元网络技术方面,有ARM中国给我们提供先进的芯片IP,我们团队本身是做复杂SoC芯片开发,7nm车规级芯片门槛非常高,我们技术团队做过10nm芯片设计,并成功量产商用,在2018年就完成了这个工作,所以我们在7nm复杂SoC设计上技术积累是非常丰富的,再有就是功能和信息安全,由于有吉利和ECARX加持,我们对车的功能安全理解非常深刻,这种深刻贯穿于规格需求到产品量产整个生命周期内,我们设计的座舱芯片和基于手机芯片演变过来的方案有差异,我们更多是从车的角度,从电子电气架构的角度来理解车规芯片算力和分配;目前我们的目标是提供软硬件平台和应用,包括复杂的SoC设计,芯片级安全设计,核心IP设计和算法工作。告诉大家一个好消息,我们7nm车规芯片已经流片了,今年年底芯片就会回来,参考设计以及整体软件,SDK等等都会提供给生态系统。
回到正题,电子电气架构从完全分布式到集中式,域集中、区集中到中央集中都是算力逐渐演进的过程,博世提供的电子电气架构趋势,我从芯片角度解释一下,它对芯片设计的规格产生了什么样的影响。
在分布式架构里面,多数模块化的功能都是通过ECU单元叠加的,就是1+1的过程,实际上对于芯片能力要求是比较低的,集中在可靠性和安全性上。MCU要求50DMIPS,现在开始走域控制器,就是把功能安全、信息安全接近的芯片进行一定的融合,形成一个域,在这个域里面做决策。这里有一个大前提,就是功能安全和信息安全要接近一致。这种情况下MCU达到了2k DMIPS,再往下就是域融合,比如说Tesla有三个域,这种情况下的算力就已经到了SoC级别,算力是50-20K DMIPS。
回到当下中央计算把大量算力集中起来,把分布式控制放在ECU端,这种情况下算力就接近50-300K DMIPS,这个时候也需要做特殊的AI加速要求,也就是100TOPS算力,最顶层是车云协同。车云协同不仅涉及到电子电气架构,还涉及到交通基础设施,网络基础设施,所以整个趋势还没有完全的确定。
这就是从分布式到集中式域融合再到区控制的过程,从几百DMIPS到几十K DMIPS。OTA升级实际上是电子电气架构变革最深刻的东西,它给整个算力的预埋,带宽的预埋,芯片的成本,应用的升级,软件定义汽车都提供了快速的通道,所以OTA升级是软件架构和芯片、电子电气架构融合的引爆点。
从电子电气架构来说,汽车智能化需要更强的运算能力,总体来说这种架构是适配未来趋势的方式。
算力也不能说无限的增长,因为我们是做芯片的,芯片PPA(功耗、成本和面积)都是很要命的,我们以前做芯片的时候很讲究功耗,有些车厂说现在是新能源,你不用担心电的问题,但是我们马上就告诉他,你不用担心电的问题,但是你要担心散热。所以我们不认为算力无限的膨胀和预埋是未来的趋势,特别是在SoC上,我们需要精准高效的算力来适配电子电气架构的变革。
这是车载芯片CPU的整体趋势,从智能座舱来说,它的起步就是60K DMIPS,未来五年市场上主流的智能座舱都是在60K DMIPS之上,传统的基于以前的座舱慢慢演进过来的曲线可能还停留在30K DMIPS范围内,这种情况下是很难适配算力集中趋势的。车身电子需要10 DMIPS,底盘15K DMIPS,半自动驾驶350K DMIPS,智能网联是20K DMIPS。
除了CPU以外,内存也是大问题。我们经常谈CPU能力,可是CPU能力都是要吞吐的,这种情况下DDR的带宽、内存子系统的设计都是关键点。这里有一个经验数据,这是在IVI和L2的时候,基本上能够达到102GB/s,如果是L3,L3+情况下要接近200GB/s,L4更大。
回到娱乐系统本身,从传统曲线来看,CPU能力2010年是10DMIPS,2020年是40DMIPS,也就是用10年才增加了3倍,可是大家想一想这个时候手机增加了多少倍?原因是什么呢?不是地图软件不行,而是算力不够。现在有变化了,现在算力两年就增加了1倍,达到80DMIPS,原因是新的座舱芯片提供者出现了,比如说高通、三星,他们都是做手机出身的,他们用手机器件晚两年做车上芯片,这个时候算力就会快速提升。为什么在新势力车企芯片里面可以看到预埋的算力,可以跨越未来好几年?它必须要保证软件定义汽车,在汽车生命周期里能够不断地适应,这个算力的预埋就变得至关重要。
GPU算力从2010年到2020年也只增加了10倍,可是2020年到2022年增长3-4倍,当屏幕变多了以后应用就变多,花样就变多,个性化需求变多了对图形处理要求就多。NPU从0到0.5经历了10年,从0.5到6.2用了两年时间,不同的计算单元适合不同的功能,比如DSP适合做数字信号处理,可以处理雷达数据,CPU做逻辑控制和通用计算,做图像图形前后处理,GPU做渲染和并行计算,NPU更多是矩阵计算。从传统计算机到深度学习到神经网络,可以看到视觉的部分越来越多,DSP部分越来越多,NN变的更多。
经常有人问你们为什么要做7nm?首先比较7纳米和16纳米,10纳米实际上是过渡的制程,7纳米比16纳米的速度增高了35%,同等性能情况下功耗降低了60%,密度是3.3倍,SRAM Scaling是0.37X,7nm有如下有点
一、7纳米的集成度更高,单位面积的晶圆上可以放置更多的逻辑门,同时封装面积变小,节约了晶圆成本和封装成本。
二、芯片耗电量更低,同样大小的逻辑电路做出来,用更先进的工艺会导致耗电量更低。半导体器件的耗电量和供电电压的平方成正比,先进工艺的管子开启电压会变小,进而导致功耗变低。
三、响应速度更快,单管开断速度更快,同样的逻辑电路能跑到的主频更高。
四、设计难度更大。这个为什么是优势?因为在芯片行业里面是有马太效应的,就是强者恒强,弱者更弱。实际上芯片公司工艺提升是互动的过程,我们提供设计文件给芯片厂做出厂测试,一个良率的降低有可能是自己设计的问题,也可能是工艺参数设置有问题。质量不稳定,性能不稳定也可能是时序设计没做好,也可能是工艺参数有问题,这个过程当中有经验的人沟通就会非常充分,这样才能够保证7纳米芯片走到量产,这是关键因素。
最后我还重点介绍了芯擎在研的车规智能座舱芯片SE1000的规格:SE1000是国内首款7纳米工艺制程高端智能座舱芯片,是采用业界领先的7纳米工艺制程设计的新一代高性能、低功耗车规级智能座舱芯片,赋能日益丰富的车载信息娱乐系统。高性能定制CPU集群,通过面向异构计算而精心设计的SOC系统,可以为用户提供卓越的性能体验。内置高性能嵌入式AI神经网络处理单元,提供更多个性化的智能语音、机器视觉及辅助自动驾驶体验。新一代多核心的图形处理单元,可以动态根据负载进行资源分配;一机多屏多系统,支持多个高分辨率屏幕同时输出;内置高性能音频信号处理单元及丰富的音频接口,为用户提供丰富超凡的音视频娱乐体验。安全性是汽车产品的生命线。芯擎自主开发实现了汽车功能安全(SAFETY)和信息安全体系(SECURITY),并准备通过ISO26262标准认证。该款产品独特的安全孤岛核心(SAFETY ISLAND)为系统提供了冗余和实时的保护,满足汽车芯片对功能安全和信息安全更加严格的标准的要求,为车载应用提供了安全保证。SE1000还具备丰富的高性能通信及外围接口支持能力,芯擎为该智能座舱芯片提供完整的软硬件平台和应用,集成开发了特定操作系统、硬件支持软件包、及软件开发包,能有效对接市场、有效缩短客户的开发过程、并助力客户早日推出产品,使该款产品具备优秀的产品化底蕴。
我今天介绍的就是这些,希望各位同仁参与到我们的生态系统里面来,谢谢大家。