Uploaded by 董毅博

高稳定集成衍射神经网络:多场景光学推理

advertisement
高稳定集成衍射神经网络实现多场景光学推理
董毅博
上海理工大学 · 智能科技学院
中国 · 杭州
1
背景
现阶段人工智能硬件的算力能耗困境
冯·诺依曼
冯诺依曼架构
2
背景
3
现阶段人工智能硬件的算力能耗困境
冯·诺依曼
冯诺依曼架构
A. Gholami, Al and Memory Wall, 2021
Human brain
ChatGPT-3
VS.
• 175 billion parameters
• 1024 A100 GPU training for 1 month
• Consumption: 400 kW
• 100 billion neurons
• Consumption: 20 W
背景
4
光子计算的优越性
光学神经网络 PNNs
• 被动传播
• 光速计算
• 低串扰
• 多维复用
•
潜在计算速度: petaMAC/s/mm2 (MAC: multiplyaccumulate operations)
•
能效: attojoule/MAC
背景
5
从空间维度划分光学神经网络
硅基等片上集成光学网络(二维)
 片上集成
 丰富的器件库
 复杂的神经元和计算功能
 神经元数目和密度有限
 计算通量有限
Ashtiani, F., et al. (2022), Nature 606, 501
衍射神经网络DNNs等(三维)
 高信息通量
 高神经元数目
 神经元连接构建简单
 难以实现集成
 神经元模型简单,缺少可重构、非线
性等功能
Lin, X., et al. (2018). Science 361, 1004.
背景
6
衍射神经网络研究
架构网络创新
应用创新
光电混
合
光学逻辑运算
Nature 623, 48–57 (2023).
光学卷积衍射网络
Science Advances 2024, 10,
eadn2205
Qian, C., et al. (2020). Light: Science
& Applications 9(1): 59.
波达角(DOA)估计
Light Sci Appl 13, 161 (2024).
集成创新
激光3D打印
Nature Communications 2022, 13,
7531
超表面CMOS集成
Luo et al. Light: Science &
Applications (2022) 11:158
背景
7
衍射神经网络集成面临的问题
 常规太赫兹波段
• 厘米体积
• 难以集成
Lin, X., et al. (2018).
Science 361, 1004.
Science Advances
2021,7,eabd7690
多层
衍射
神经
网络
集成
有机物材料,
可靠性、稳
定性差
3D
打
印
Goi, E., et al. (2021). Light: Science &
Applications 10, 40.
网络变为二维,
失去了高通量
优势
硅
光
Nature Communications 2023, 14, 70.
背景
为什么要衍射神经网络需要多层?
• 深度神经网络中的单层运算
*矩阵乘法
.*元素对应相乘
Y=W*X+B
W为权重矩阵,每个元素可训练
• 衍射神经网络中的单层运算
Y=X*WDNN.*T
WDNN为瑞利索末菲衍射定义的传播矩阵,在波长、
像素、距离确定时为常数。训练的是透射矩阵T。
• 增加衍射层数,可以使权重矩阵的元素随机性增加
Y=X*WDNN.*T1*WDNN.*T2*WDNN.*T3*WDNN
趋近
Y=X*W(深度神经网络权重取值)
8
背景
为什么要衍射神经网络需要多层?
• 深度神经网络中的单层运算
*矩阵乘法
.*元素对应相乘
Y=W*X+B
W为权重矩阵,每个元素可训练
• 衍射神经网络中的单层运算
Y=X*WDNN.*T
WDNN为瑞利索末菲衍射定义的传播矩阵,在波长、
像素、距离确定时为常数。训练的是透射矩阵T。
• 增加衍射层数,可以使权重矩阵的元素随机性增加
Y=X*WDNN.*T1*WDNN.*T2*WDNN.*T3*WDNN
趋近
Y=X*W(深度神经网络权重取值)
9
双层集成衍射神经网络
将双层衍射神经网络集成在一个透明石英晶圆的正反面
 Wavelength: 532 nm
 Layer spacing: 500 um
 Pixel number of each layer: 1000x1000;
 Pixel size: 8x8 um2
Yibo Dong, et al. Communications Engineering 3, 64 (2024)
10
11
双层集成衍射神经网络
将双层衍射神经网络集成在一个透明石英晶圆的正反面
DNN
chip
 Wavelength: 532 nm
 Layer spacing: 500 um
 Pixel number of each layer: 1000x1000;
 Pixel size: 8x8 um2
1 cm
DNN
chip
x1
x2
x3
∑ ejφ1
1
∑ ejφ2
1
∑
∑
ejφ1
2
y1
ejφ2
2
y3
…
…
…
…
xn
∑ ejφ1
n
∑ ejφ2
n
y1
Input
Yibo Dong, et al. Communications Engineering 3, 64 (2024)
y1
0
Output
1st layer
2nd layer
12
双层集成衍射神经网络
衍射神经网络设计
Bilayer DNNs:Recognize handwritten
digits of 0 to 9 (binary phase modulation)
1st layer
2nd layer
Monolayer DNNs:Recognize handwritten
digits of 0 and 1 (4-level phase modulation)
Yibo Dong, et al. Communications Engineering 3, 64 (2024)
双层集成衍射神经网络
13
训练结果
Training set: accuracy: 96.1%
Yibo Dong, et al. Communications Engineering 3, 64 (2024)
14
双层集成衍射神经网络
芯片制备
1. Spin coating photoresist
2. Photolithography
3. Dry etching
4. Dissolve photoresist
with acetone
5. Spin coating photoresist
6. Photolithography
8. Dissolve photoresist
with acetone
9. Spin coating photoresist
Phase: 0
Phase: 0
10. Photolithography
11. Dry
etching
3/2pi: 6974 Å
Pi: 4753 Å
Phase: 1/2
pi
12. Dissolve photoresist
with acetone
Height (Å)
7. Dry etching
1/2pi: 2309 Å
Phase: 3/2
pi Phase: pi
Phase: 1/2
Phase: 0
pi
Yibo Dong, et al. Communications Engineering 3, 64 (2024)
15
双层集成衍射神经网络
实验光路
• 双层DNNs:识别0~9
Test set: accuracy: 85.4% Test set: accuracy: 82%
(Experimental)
(Simulation)
实验结果
• 单层DNNs:识别0~1
Test set: accuracy: 100%
(Experimental)
Yibo Dong, et al. Communications Engineering 3, 64 (2024)
16
双层集成衍射神经网络
• 衍射神经网络误差分析
• 对齐误差
• 层间距误差
• 波长误差
• 输入层偏移误差
Yibo Dong, et al. Communications Engineering 3, 64 (2024)
17
双层集成衍射神经网络
芯片老化寿命分析(阿伦尼乌斯公式)
• 石英基底衍射神经网络具有高稳定性
• 老化后仍可以稳定工作
• 300K: 5.81×1042 s (1.84×1023 trillion years)
• 500K: 7.71×1023 s (2.44×104 trillion years)
•
•
•
•
•
k is the decay rate
A is the frequency factor,
kB is the Boltzmann constant
Ea is the activation energy
T is the absolute temperature
Yibo Dong, et al. Communications Engineering 3, 64 (2024)
多场景工作的集成衍射神经网络(水和空气)
“水路两栖”衍射神经网络芯片
Haitao Luan, Yibo Dong*, Qiming Zhang*, Min Gu*. Chinese Optics Letters 22, 12 (2024) (Invited)
18
19
多场景工作的集成衍射神经网络(水和空气)
• 芯片结构模型
“水路两栖”衍射神经网络芯片
• 芯片运算模型
Haitao Luan, Yibo Dong*, Qiming Zhang*, Min Gu*. Chinese Optics Letters 22, 12 (2024) (Invited)
• 芯片样品
多场景工作的集成衍射神经网络(水和空气)
多目标优化算法
通过多目标优化实现水中和空气中同时工作的网络训练,同时考虑水中和空气中的相
位调制差异,对相位取值范围进行约束(水:0~2pi;空气:0~6pi)
Haitao Luan, Yibo Dong*, Qiming Zhang*, Min Gu*. Chinese Optics Letters 22, 12 (2024) (Invited)
20
21
多场景工作的集成衍射神经网络(水和空气)
• 加工相位调制偏差影响
• 衍射层(训练)
• 衍射层(实验)
• 对齐误差影响
Haitao Luan, Yibo Dong*, Qiming Zhang*, Min Gu*. Chinese Optics Letters 22, 12 (2024) (Invited)
多场景工作的集成衍射神经网络(水和空气)
• 实验光路
Haitao Luan, Yibo Dong*, Qiming Zhang*, Min Gu*. Chinese Optics Letters 22, 12 (2024) (Invited)
22
23
多场景工作的集成衍射神经网络(水和空气)
• 实验结果
• 混淆矩阵(每类测试250张)
91.5%
91.4%
四类
数字
94.6%
四类
物品
Haitao Luan, Yibo Dong*, Qiming Zhang*, Min Gu*. Chinese Optics Letters 22, 12 (2024) (Invited)
92.6%
石英/硅基底多值相位版的高精度加工
• 衍射神经网络的阶数对准确率和衍射效率会产生影响
• 如何实现高稳定(石英等)、纳米级分辨率的多
值衍射板制备:
(1)电子束光刻 (工艺复杂、效率低)
(2)纳米压印(自由度低)
Table 1. The simulated accuracy of fashion products
recognition with different phase discretization levels
Phase
discretization
Air
Water
256-level
98.7%
98.5%
8-level
98.1%
98.1%
4-level
97.4%
97.5%
2-level
96.3%
96.8%
Accuracy (test set)
24
25
石英/硅基底多值相位版的高精度加工
• 衍射神经网络的阶数对准确率和衍射效率会产生影响
• 如何实现高稳定(石英等)、纳米级分辨率的多
值衍射板制备:
1. 激光打印三维掩膜
2. ICP共刻蚀
(气体工艺选择)
(1)电子束光刻 (工艺复杂、效率低)
(2)纳米压印(自由度低)
Table 1. The simulated accuracy of fashion products
recognition with different phase discretization levels
Phase
discretization
Air
Water
256-level
98.7%
98.5%
8-level
98.1%
98.1%
4-level
97.4%
97.5%
2-level
96.3%
96.8%
Accuracy (test set)
3. 灰度光刻
石英/硅基底多值相位版的高精度加工
• 一次加工实现4-8值相位衍射板
• 加工分辨率百纳米
• 也可以实现石英衬底的双面对齐光刻和加工
8值相位版(硅)
Unpublished
8值相位版(石英)
2
6
展望:衍射神经网络的三维集成
• 光计算系统的计算速度受限于最慢的模块——输入
• 目前,人类的数据存储主要是数字信息,直接处理
外界模拟光信息的应用场景小
SLM
(几十Hz~几百Hz)
Mask
Lin, X., et al. (2018). Science 361, 1004.
27
28
展望:衍射神经网络的三维集成
• 光计算系统的计算速度受限于最慢的模块——输入
• 目前,人类的数据存储主要是数字信息,直接处理
外界模拟光信息的应用场景小
• 引入VCSEL阵列作为
数字编码光源
SLM
(几十Hz~几百Hz)
Mask
Lin, X., et al. (2018). Science 361, 1004.
Types
Size of
Modulation
optical setup bandwidth
DNNs w
VCSEL
10-3~10-2 m
GHz
DNNs w/o 10-1~100 m
VCSEL
kHz
Min Gu*, Yibo Dong*, et al., Nanophotonics 2023; aop
29
展望:衍射神经网络的三维集成
• 三维光芯片垂直集成:光源、衍射网络、探测器
• 科学难点:基于VCSEL光源的网络设计(模式、相干性)
Detector array
Data output
dog
cat
duck
bird
fish
frog
DNNs
Data processing
VCSEL array
Data input
3D vertical integrated
photonic chip
Min Gu*, Yibo Dong*, et al., Nanophotonics 2023; aop
30
展望:VCSEL在自由空间光计算中会有重要应用
• 自由空间光计算的方案不止衍射一种
• VCSEL可以作为神经元、光源、非线性
层,实现储备池计算、深度神经网络、
脉冲神经网络
Nat. Photon. 17, 723–730
(2023).
GuanZhong Pan, Meng Xun*, Yibo Dong*. et al, Light: Science & Applications 13, 229 (2024)
致谢
顾敏院士、方心远教授、栾海涛副教授参与指导
31
Shanghai Municipal Commission
of Science and Technology
 合作单位:中国科学院微电子研究所
吴德馨院士、荀孟副研究员、潘冠中副研究员
Shanghai Municipal
Commission of Education
2024年神经形态光子学国际会议 11月23-24日 上海
32
主办单位
上海理工大学智能科技学院 上海理工大学光子芯片研究院
大会主席
Conference Chairs
顾敏 院士
崔铁军 院士
Lorenzo Pavesi 教授
大会报告主讲人
Stefan W. Hell 马克斯·普朗克医学研究所
崔铁军 东南大学
Martin Booth 牛津大学
陈红胜 浙江大学 中国
傅岚 澳大利亚国立大学
Lorenzo Pavesi 特伦托大学
Ripalta Stabile 埃因霍芬理工大学
万青 南京大学
谢谢!
请各位专家批评指正!
Download