用于神经网络训练的光子张量核集成电路架构及其神经网络训练方法
摘要:
一种用于矩阵计算的光子张量核集成电路的硬件架构及其神经网络训练方法。基于光电混合相干探测与电子累积原理,实现了一种集成化的光子点积计算单元(以下简称DPU),并且将DPU阵列式排布,形成大规模并行化的矩阵乘法计算硬件,即张量核。通过双层扇入波导总线设计,实现了二维大规模DPU阵列的互连。本发明还具体提出了将光子张量核集成电路应用于神经网络训练中的方法。本发明实现高速数据加载与高速矩阵计算;避免的了光电时钟速率不匹配导致的木桶短板效应;双层波导总线设计避免波导交叉的损耗与串扰;可以应用于所有包含矩阵计算的算法中,包括神经网络推理与训练。
0/0