光学预处理新研究!加州大学证明了混合计算机视觉系统的可行性
2160
图像分析在当代技术中无处不在:从医疗诊断到自动驾驶车辆再到面部识别。使用深度学习卷积神经网络的计算机(处理图像的算法层)已经彻底改变了计算机视觉。
但是,卷积神经网络(CNN)通过从先前训练的数据中学习,经常记忆或发展成定式来对图像进行分类。而且比较容易受到对抗性攻击,这些攻击以图像中微小的、几乎无法察觉的扭曲形式出现,从而导致错误的决策。这些缺点限制了CNN的实用性。
将计算机视觉与光学预处理器相结合可以提高图像处理算法的能源效率和可靠性,由于光在预处理阶段不耗费能量就能完成数学函数,因此使用混合计算机视觉系统可以大大节省时间和能源。这种新兴的方法可能能克服深度学习的缺点,还能充分利用光学和电子学的优势。
最近发表在《Optica》上的一篇论文中,加州大学河滨分校机械工程教授Luat Vuong和博士生Baurzhan Muminov通过应用光学涡旋,即具有暗中心点的漩涡光波,证明了混合计算机视觉系统的可行性。涡旋可以被比喻为当光线绕过边缘和角落时产生的流体动力漩涡。
涡旋的知识可以扩展到理解任意的波型。带有涡旋时,光学图像数据以一种突出和混合光学图像不同部分的方式传播。Muminov和Vuong发现,用浅层的 "小脑 "神经网络进行涡旋图像预处理,这些神经网络只有几层算法需要运行,可以代替CNN发挥作用。
"光学涡旋的独特优势在于其数学上的边缘增强功能,"Vuong说。"在本文中,我们展示了光学涡旋编码器以这样一种方式生成物体强度数据,即一个小脑神经网络可以从其光学预处理模式中快速重建原始图像。"
光学预处理降低了图像计算的功耗,同时电子学中的数字信号识别相关性,提供优化并快速计算出可靠的决策阈值。通过混合计算机视觉,光学具有速度快和低功耗计算的优势,CNN的时间成本降低了两个数量级。通过图像压缩,可以显著降低电子后端硬件,无论是在内存还是计算复杂性方面。
论文标题为《Fourier optical preprocessing in lieu of deep learning》。