汽车产业正在经历变革,产品开发周期变得越来越短。为提升技术领先地位,科技公司大陆集团投资搭建了属于自己的人工智能(AI)超级计算机。该超级计算机由运用 NVIDIA InfiniBand 互连技术连接的 DGX 系统提供动力支持。位于法兰克福的超级计算机数据中心,为全球各地的开发人员提供计算能力和存储功能。 人工智能使高级驾驶员辅助系统变得强大,令出行变得更加智能和安全,让无人驾驶可以在中期实现商业落地。
大陆集团高级驾驶员辅助系统事业部项目管理系统负责人 Christian Schumacher 表示:“超级计算机是我们对未来的投资。这个最先进的系统可以同时进行至少 14 次以上的实验,从而大大缩短我们训练神经网络所需的时间。”
携手英伟达保证最高品质
Schumacher 表示:“在寻找合作伙伴时,我们看重两个方面:品质与速度。该项目的时间非常紧张,我们计划在一年之内完成。经过大量的测试和考察,大陆集团选择了英伟达,这是一家为全球多台最快的超级计算机提供动力支持的公司。”
英伟达企业计算部门负责人 Manuvir Das 表示:“NVIDIA DGX 系统能够为像大陆集团这样的创新企业提供了高成本效益且易于部署的企业级人工智能超级计算解决方案。大陆集团运用以 InfiniBand 互连技术连接的 NVIDIA DGX POD 对自动驾驶汽车进行训练,可以设计出最智能的未来汽车以及构建与汽车设计配套的 IT 基础设施。”
以信息技术领域的科技杰作实现基于人工智能的解决方案
大陆集团的超级计算机由 50 多个 NVIDIA DGX 系统构成,与 NVIDIA Mellanox InfiniBand 网络相连。根据公开的超级计算机 500 强榜单的数据,这个超级计算机的性能在全球汽车行业中独占鳌头。超级计算机采用混合模式,在需要时可通过云解决方案扩展容量和提高存储性能。Schumacher 解释说:“超级计算机是 IT 基础设施设计中的一项杰作。为了使超级计算机具备如今的完整性能和功能,以及支持未来扩展的可扩展性,我们的团队精确地规划了每一个细节。”
高级驾驶员辅助系统利用人工智能使汽车能够做出决策、辅助驾驶员并最终实现自主驾驶。雷达和摄像头环境传感器可为车辆提供原始数据。智能系统会实时处理这些原始数据,创建车辆周围环境的综合模型(感知),制定相应的驾驶策略(规划)。最后,需要对车辆进行控制,使其执行规划的策略(行动)。但是,随着系统变得越来越复杂,传统的软件开发方法和机器学习方法已经达到了极限。深度学习和仿真已成为基于人工智能的解决方案的基本开发方法。
主要用例:深度学习、仿真和虚拟数据生成
通过深度学习,人工神经网络可以让机器从经验中学习并将新信息与现有知识联系起来,仿真人脑内部的学习过程。但是,一个孩子只要看过几十张不同款汽车的图片就能识别出不同的汽车,而要让神经网络学会辅助驾驶员,甚至于自主驾驶车辆,却需要用到数以百万计张的图片,用大量数据耗费数千个小时对其进行训练。NVIDIA DGX POD 不仅减少了这一复杂过程所需的时间,还可缩短了新技术的上市时间。
大陆集团匈牙利达佩斯人工智能能力中心负责人 Balázs Lóránd 与其团队一直致力于开发支持人工智能创新的基础设施,他表示:“总的来说,我们预估完成全面神经网络训练所需的时间将从数周缩短至数天。在过去几年里,我们的开发团队的人数和经验一直在增长。借助超级计算机,我们能够根据需求更好地扩展计算能力,并充分发掘开发人员的全部潜力。”
目前,训练神经网络所用的数据主要来自大陆集团的测试车队。车队每天行驶 15000 公里左右,收集约 100 TB的数据,这一数据量相当于 50000 小时的电影。所记录的数据可以通过回放来仿真实车测试,用于开展新系统训练。超级计算机可综合生成数据,这是一种高度消耗计算能力的用例,能够让系统从仿真环境下的虚拟行驶中进行学习。
对于开发流程而言,超级计算机具有多个优点: 首先,从长远来看, 由于系统本身就可以即时创建必要的训练场景,或将不再需要记录、存储和挖掘现实车队生成的数据。其次,它提高了开发速度,因为虚拟车辆只要几个小时就能走完现实汽车需要数周才能行驶完的路程。第三,综合生成数据这一特性可以让系统处理和应对不断变化和不可预测的情况,最终使车辆能够在变化无常的和极端的天气条件下安全行驶,或者对行人的移动做出安全预测,为实现更高级别的自动化铺平道路。
扩展能力是 NVIDIA DGX POD 概念背后的主要推动力之一。借助科技的力量,机器学习可以比任何人为控制下的学习学得更快、更好、更全面,并且随着每一步的演化,其潜在性能将呈指数级的增长。
这台超级计算机位于法兰克福的数据中心,之所以选择此处,是因为其靠近云服务提供商,更重要的是,这里有应用人工智能的环境,能够满足冷却系统、网络连接和供电方面的特定要求。计算机使用经认证的绿色能源供电,GPU 集群在设计上比 CPU 集群具有更高的能源效率。