近日,芬兰阿尔托大学的研究团队展示了一种名为“并行光学矩阵-矩阵乘法器”(POMMM)的新型光学计算架构,该技术有望解决人工智能(AI)模型训练和执行中的核心瓶颈问题。POMMM通过利用单次相干光的传播过程完成矩阵与矩阵的乘法运算,其核心原理是将数字张量编码为光的相位和振幅,并通过透镜组实现傅里叶变换,最终以干涉图像的形式被高速探测器捕捉。这种算术过程在光的“飞行”中瞬间完成,无需电子环路或内存读取,实现了物理层面的“自然同步计算”。
研究团队基于现成的光学元件搭建了原型机,并在标准光学平台上耗时六个月完成组装。测试结果显示,对于最大50x50的矩阵,该原型的平均绝对误差(MAE)低于0.15,归一化均方根误差(RMSE)则保持在0.1以下,满足许多边缘推理应用的需求。尽管当前原型机的能效仅为2.62GOP/J,远低于顶尖GPU,但其运算延迟可达纳秒级,远胜于电子计算的微秒级。研究团队已在GitHub上开放了所有代码和数据,以加速技术验证和社区发展。
研究人员指出,探测器的动态范围和校准漂移是目前需要攻克的难题。未来的技术路线图非常清晰,通过将空间光调制器和探测器阵列等关键部件集成到低损耗的氮化硅光子芯片上,能效有望实现百倍提升。团队预测,集成了专用光子芯片的原型机有望在三年内问世,预计能将能效提升至300GOP/J,远超电子GPU目前约30GOP/J的能效瓶颈。不过,考虑到封装、温控和激光器集成等工程挑战,距离实现大规模量产可能还需要五年以上的时间。

