人类天生就能够根据周围环境中其他人的行为来调整自己的行为。例如,由于人类驾驶员能感知在特定场景中哪些操作是危险的,因此会根据其他驾驶员、行人或骑行者的动作,选择停车、减速、转向或启动车辆。然而,目前,开发具备此种能力的自动驾驶车辆面临巨大的挑战。
(图片来源:https://techxplore.com)
据外媒报道,斯坦福大学(Stanford University)和丰田研究院(Toyota Research Institute)的研究人员开发了一个框架,可以防止此类事故的发生,从而提高自动驾驶汽车和其他机器人系统在拥挤环境中运行的安全性。该框架结合了两种工具,一种机器学习算法,以及一种风险敏感控制的技术。
研究人员Haruki Nishimura和Boris Ivanovic表示,“我们的主要目的是通过预测人类驾驶员、行人和骑行者等道路使用者的意图,使自动驾驶汽车和其他机器能够安全运行。”Nishimura, Ivanovic及其同事开发了一种机器学习模型,并训练其在机器人所处的环境中预测人类未来的行为。利用该模型,他们创建了一种算法,可以估算既定时间内机器人每一次潜在行为所带来的碰撞风险。该算法可以自动为机器人选择最优行为,使其与他人或车辆相撞的风险降到最低,同时使机器人继续前行。
研究人员还表示,“现有的导航方法通常存在两个重要的过度简化问题。首先,这些方法仅对人类未来的行为做出了简单的假设;其次,没有考虑平衡碰撞风险和机器人的前行行为。而我们的方法使用丰富的、随机的人体运动模型,该模型是从真实的人体运动数据中学来的。”
该框架所基于的随机模型并不提供对未来人类行为的单一预测,而是预测的分布。此外,该团队使用该模型的方式与此前开发的集成随机模型的机器人导航技术的方式显著不同。
Nishimura和Ivanovic explained解释道,“我们考虑了未来人类移动可能性的全部分布情况。然后,再选择机器人的下一个动作,以实现低碰撞风险,同时仍然使机器人朝着目标方向前行。这一过程称作风险敏感最优控制,本质上允许实时确定机器人的下一步行动。其所需的计算仅在几分之一秒内就能完成,并在机器人移动时不断重复。”
为了评估该框架,研究人员进行了模拟研究和真实世界实验。在模拟研究中,他们比较了该框架与三种常用避碰算法在执行一项任务时的性能。在这项任务中,机器人必须确定最佳行为,以在包含多达50名移动人员的环境中安全航行。此外,在真实世界实验中,研究人员使用该框架指导机器人,在具有5名移动人员的室内环境中移动。两项测试结果均显示,该框架计算出了最佳轨迹,将机器人与周围人类碰撞的风险降至最低。而且,其性能也优于与其他避碰算法。
研究人员表示,“我们的首要目标是让自动驾驶汽车和其他机器人对人类更安全,为了确保机器人在人类周围安全运行,我们需要教会它们根据经验预测人类的行为,并赋予其对风险的感知能力,从而避免做出可能导致碰撞的危险行为。”
未来,此种导航框架有望使机器人和自动驾驶汽车预测周围人类或车辆的行为,并迅速做出反应,以防止碰撞,从而提高安全性。然而,在大规模部署之前,该框架还需要在大型数据库中进行训练,这些数据库包含人类在拥挤环境中移动的视频,类似于机器所处的拥挤环境。为了简化训练过程,研究人员计划开发方法,让机器人在运行时在线收集训练数据。
Nishimura与Ivanovic表示,“我们还希望使机器人能判断其所处环境中人类的特定行为。例如,在任何给定时刻对行为古怪的驾驶员或醉酒驾驶员进行分类,并避免离此类驾驶员过近,从而减少碰撞风险。人类驾驶员能很自然地做到这一点,但要将其编写成机器人可以使用的算法非常困难。”