据外媒报道,来自拉德堡德大学(Radboud University)、奥斯丁大学(University of Austin)、加州大学伯克利分校(University of California, Berkeley)和埃因霍温科技大学(Eindhoven University of Technology)的研究人员找到了一种应对不确定性的新方法,可以帮助AI(如自动驾驶汽车)更快找到更安全的决策选项。
(图片来源:https://techxplore.com)
研究人员将此种方法称作“不确定部分可观察马尔可夫决策过程”(uncertain partially observable Markov decision processes ,或uPOMDPs)。这些是真实世界模型,用于估算事件发生的概率。例如,自动驾驶汽车在驾驶时会面临许多未知的情况,为了验证自动驾驶汽车的AI,需要进行大量的计算,以分析AI如何应对各种情况。研究人员认为,利用他们的新方法,这些建模练习可以变得更加接近现实,从而使AI更快地做出更好、更安全的决策。
此前,POMDPs已用于模拟和建模多种情形,可以帮助预测流行病传播,以及计算航空和宇宙飞船如何避碰等。研究人员Nils Jansen表示,“我们知道,这些模型非常擅长提供真实世界的真实捕捉。然而,由于使用它们需要极高的处理能力,因此在实际应用中的应用仍然有限。而我们的新方法能使我们考虑所有计算和理论信息,并能在现实世界中更加一致、定期地运用。”
研究人员通过四个步骤来提供有效的解决方案。首先,将问题描述为具有无穷多个约束的非凸优化问题。其次,通过专用对偶方案生成仍是非凸的,但具有有限多个约束的对偶问题。然后,将这一对偶问题线性化。最后,求解这一有限线性规划,从而得到原有问题的局部最优解。与现有方法相比,这一求解问题公式远远小于现有方法生成的公式。此外,研究人员还通过飞行器避碰场景和新型航天器运动规划案例研究,来验证该算法的适用性。
研究团队的突破之处在于其模型考虑了现实世界的不确定性。Jansen表示,“例如,目前的模型可能只会告诉你,自动驾驶汽车有80%的可能性是完全安全的,但还不清楚剩下的20%可能会发生什么,以及风险类型。这可能是一种不清晰、模糊的风险,而有了这种新方法,系统就可以对可能出现的问题给出更详细的解释,并在计算时考虑这些因素。对用户而言,这意味着能知道更多可能出错的具体例子,并做出更好、更充分的调整,从而避免这些风险。”
虽然此前也有其他研究人员考虑过uPOMPDPs所采用的方法,但仅限于特定的有限情形和思维实验。Jansen解释称,“这是我们首次将先前的理论思维实验转化为实际可行的方法。这是一个独特、困难的问题,但得益于跨学科方法,我们才能够取得真正的突破。”