电装集团(Denso)开发出了利用单眼摄像头,快速实时识别行人的身体朝向、身高以及与汽车的距离等多种信息的技术。已通过实验确认,在模拟车载设备的演示环境下,处理时间只需56毫秒。电装打算将该技术应用于汽车的ADAS(高级驾驶辅助系统)。
识别多种特征时,处理的数据量庞大,因此采用原来的方法难以进行实时处理。电装此次通过调整图像数据的处理方法缩短了计算时间。同时,计算量也降至原来的1/10左右,在计算能力有限的车载半导体上也可使用。
调整DNN 满足ADAS的要求
该技术由电装的子公司Denso IT Laboratory开发。图像识别算法采用了深度学习的一种——DNN(Deep Neural Network,深度神经网络)。
以前进行图像处理时采用的是方向梯度直方图(HOG)和线性支持向量机(SVM)相组合的算法,但只能做出图像中有没有人这种简单判断。不能并行求出多个特征量,因此无法确定行人朝向、与车辆的距离等行人的状态和属性。
新开发的图像识别方法利用DNN并行处理图像中的多种不同信息。改进了名为“图像金字塔”的方法,提高了处理速度。原来的图像识别通过反复进行20-30次左右的“缩小分辨率-识别”过程,确保识别精度。此次,通过将循环次数减少到2-3次,减少了计算量。
该公司研究开发部研究员佐藤育郎介绍说,“能够以16-17帧/秒的速度(帧率)处理影像”。应用于汽车ADAS时,通常要求影像的帧率达到“10-15帧/秒左右”,此次的技术满足了这一要求。
行人检测以及基于携带手机等图像特征的处理通过图像识别进行分类。行人与汽车之间的距离可通过确定行人站立位置,根据函数求出。身体朝向可根据 角度的数值信息进行判断。电装在2016年8月25日召开的记者说明会上进行了演示,表明通过采用该技术,可实时判断行人朝向、身高及与汽车的距离。
佐藤说,采用该技术,“甚至可以推测出年龄段及是否携带手机”。不过,做任何判断都必须要有用于深度学习的“正确数据”。电装集团尚未建立起年龄段及有无手机等状态的正确数据,今后将建立这些数据。