一种无需非线性结构的光学卷积神经网络

发布日期:2024年5月31日
一种无需非线性结构的光学卷积神经网络 一种无需非线性结构的光学卷积神经网络

本内容试读结束

下载后可阅读完整内容,立即下载

卷积神经网络在视觉处理方面具有独特的优势。最近的一些研究使用光学的卷积神经网络来实现更为快速和低功耗的图像处理系统。我们的工作提出了一种无需额外非线性结构的光学卷积神经网络,使用绝对值函数作为激活函数,设置了特定的三层卷积神经网络,该网络对MNIST和Fashion-MNIST数据集的识别准确率与目前普遍使用的激活函数相差不大。通过对软件仿真与硬件仿真的结果进行对比,发现图像经过第一层卷积和非线性后的结果误差不超过2%,输出结果验证了我们的光学卷积神经网络对图像处理的有效性。这为实现高效可编程的光学卷积神经网络提供了可行方案。

随着机器学习技术的发展,卷积神经网络(Convolutional Neural Network, CNN)已经成为应用最广泛的机器学习技术之一。

尤其在视觉应用领域, CNN 具有独特的特征提取和识别能力, 在对图像进行检测, 分类和分割中表现出突出的性能优势[1]。然而随着网络的规模与复杂度的增加,网络训练的效率也随之降低,传统的计算系统在提供高算力的同时也会占用大量的资源,这使得人们把注意力转移到更具优势的光学神经网络结构上[2]。光子神经网络能够结合光电子技术与人工智能技术两者的优势,构建出高速度和低功耗的网络结构,突破了传统电子神经网络的瓶颈,在进行图像处理和目标识别方面具有较高的前景。

2018 年,Bagherian 等人提出了片上光学CNN [3],利用时分复用的方式实现了一种基于集成器件的光学卷积方法。2021 年,Xu 等人采用光电混合设置方式实现光学卷积[4],由MZIs 阵列组成的集成光子电路执行光学矩阵乘法(MAC)操作,光学干涉装置(OIU)完成与卷积相关的矩阵乘法操作,同时FPGA 对OIU 进行编码和调制。另外激活函数在当前的光学神经网络研究中必不可少,但实现非线性的激活功能仍然是光子计算硬件的关键挑战之一[5]。通过利用光学非线性材料如饱和吸收体[6] [7]、石墨烯[8]等特有的传输特性,可以充当卷积神经网络中的非线性激活函数。Williamson 等人提出了一种MZI 网格兼容的非线性O/E/O (Opto-Electro-Optical) 节点设计,证明了类ReLU 函数以及类似于有界激活的截断非线性响应[9]。

J. Feldmann 等将PCM (Phase-Change Material)单元集成为MRR (Micro-Ring Resonator)的一部分,通过输入光功率改变PCM 晶体状态产生非线性作用[10]。但这些方法有的难于精准控制,有的则需要将信号通过数模转换器(Analog-to-Aigital Converter, ADC),如此便会降低运行速度。

在本文中,我们使用基于MZI 的可编程的纳米光子芯片来进行矩阵乘法运算,在卷积神经网络中采用绝对值函数作为激活函数。构造的光学卷积神经网络避免了使用具体的非线性运算结构,在对图片进行卷积时,硬件仿真得到的结果能够与软件仿真得到的卷积结果基本一致,由此可以推断我们的光学卷积神经网络能够对图像进行有效的识别。

2. 卷积神经网络的背景 CNN 是一种深度学习方法,与其他方法相比,CNN 需要较少的预处理,是理解图片材料最有效的



相关标签