从医学诊断到自动驾驶汽车,再到面部识别,图像分析在当代技术中无处不在。而使用深度学习卷积神经网络(CNN)这种图象处理算法层的计算机已彻底改变了计算机视觉。
(图片来源:https://techxplore.com/)
但CNN通过学习之前训练过的数据来对图像进行分类,通常是凭借记忆或生成刻板印象。而且CNN也容易受到对抗性攻击,这种攻击以微小的、几乎察觉不到的形式出现在图象中,从而导致错误的决定。这些缺点限制了CNN的实用性。此外,人们越来越意识到,像CNN这类深度学习算法还会产生过高的碳足迹。
提高图像处理算法能效和可靠性的一种方法是将传统的计算机视觉与光学预处理相结合,这种混合系统只需极少的电子硬件。由于光可在预处理阶段完成数学功能而不消耗能量,因此混合计算机视觉系统可以显著节省时间和能耗。这种新兴的方法可以克服深度学习的缺点,并利用光学和电子学的优势。
据外媒报道,加州大学河滨分校机械工程教授Luat Vuong和博士生Baurzhan Muminov通过应用光学涡旋,证明了混合计算机视觉系统的可行性。这种涡旋光波有一个黑暗的中心点,漩涡可以比作光绕着边缘和角落移动时产生的流体动力漩涡。
涡旋的知识可以扩展,用于理解任意波型。当产生光学涡旋时,光学图像数据会以突显并混合光学图像不同部分的方式传播。Muminov和Vuong表明,使用仅需运行几层算法的浅层“小型大脑”神经网络进行漩涡图像预处理,可能取代CNN的功能。
Vuong解释称,“光涡旋的独特优势在于其数学性边缘增强功能。我们展示了光学涡旋编码器生成物体强度数据的方式,使得小型大脑神经网络可以根据光学预处理模式快速重建原始图像。”
光学预处理可降低图像计算功耗,而电子设备中的数字信号可识别相关性,提供优化,并快速计算可靠的决策阈值。借助混合计算机视觉,光学具有速度和低功耗计算的优势,并将CNN的时间成本降低了两个数量级。通过图像压缩,可以在存储和计算复杂性两方面大幅减少电子后端硬件。
Vuong表示,“我们关于涡旋编码器的演示表明,光学预处理可以取代CNN,比CNN更稳健,并且能够总结逆问题解决方案。例如,我们证明,当混合神经网络学习手写数字的形状时,随后就能重建以前没有见过的阿拉伯或日语字符。”
Vuong和Muminov的论文还表明,将图像缩减为更少的高强度像素,能够实现极低光线的图像处理。该项研究为光子学在构建通用的小脑混合神经网络,以及开发用于大数据分析的实时硬件方面的作用提供了新见解。