一年前,Scale和NuTonomy发布了自动驾驶数据集NuScenes,并声称,该数据集在规模和准确性上都超过了KITTI、百度ApolloScape和Udacity自动驾驶汽车数据等数据集。自此,业内涌现出各种更多样化的新数据集,如Waymo Open Dataset、福特自动驾驶汽车数据集,以及Lyft的自动驾驶汽车数据集。据外媒报道,日前,Motional(其首席执行官创立了NuTonomy)发布了扩展版本的NuScenes数据集。
(图片来源:Motional)
NuScenes这类数据集可用于提高自动驾驶汽车在各种环境中的鲁棒性。美国研究机构兰德公司(Rand Corporation)估计,自动驾驶汽车需要行驶110亿英里才能获得可靠的安全数据,但由于一些困难减慢了现实世界中的测试速度,因此仿真驾驶里程成为最佳选择。
NuScenes的扩展包括NuScenes-lidarseg,改进了1,000个新加坡和波士顿场景的语义分割,使其成为最大的开放激光雷达分割数据集之一。据Motional介绍,NuScenes-lidarseg添加了14亿个带标注的激光雷达点,与原始边界框相比,能提供更详细的车辆环境图片,从而使研究人员可以研究激光雷达点云分割和前景提取等内容。
此次扩展后的数据集还包括新的数据集NuImages,包含近10万张带注释的2D图像,以代表一系列具有挑战性的、“教育意义”的驾驶条件。Motional表示,NuImages根据用户需求而创建,旨在帮助自动驾驶汽车在无法预测的场景下安全行驶。
NuScene-lidarseg和NuImages都以现有NuScenes数据集为基础,NuScenes该数据集包含数百个场景,其中包括超过100万张由摄像头、激光雷达、雷达、GPS和惯性测量传感器捕获的图像。Motional表示,自2019年3月发布以来,已有超过8000名研究人员使用过NuScenes,10多个新数据集已经公开,250多篇科学论文引用了其数据。