清华最新Science论文：方璐/戴琼海团队开发太极光芯片，赋能通用人工智能|science|人工智能技术|光子|戴琼海|方璐|清华|神经网络

编辑丨王多鱼

排版丨水成文

对通用人工智能（AGI）的追求不断要求更高的计算性能。光子计算有潜力实现这些目标，目前的光子集成电路具有优越的处理速度和效率，但其容量和可扩展性受到不可避免的误差的限制，规模和计算能力有限，因此只能实现简单的任务和浅层模型，几乎不能支持现代AGI任务。

2024年4月11日，清华大学方璐副教授、戴琼海院士团队合作，在国际顶尖学术期刊Science期刊发表了题为： Large-scale photonic chiplet Taichi empowers 160-TOPS/W artificial general intelligence 的研究论文。

针对大规模光电智能计算难题，研究团队摒弃传统电子深度计算范式，另辟蹊径，首创了分布式广度光计算架构，研制了大规模干涉-衍射异构集成芯片——太极（Taichi），实现160万亿次/秒·瓦（TOPS/W）的通用智能计算。研究团队表示，预计太极光芯片将跟上现代AGI对计算资源需求的快速增长。

Science期刊编辑高度评价了这项研究：该研究探索了分布式衍射干涉混合光计算架构，有效地将光神经网络（ONN）的规模提高到百万神经元级别。通过实验实现了一个芯片上1396万个神经元的ONN，用于复杂的、千类级的分类和人工智能生成的内容任务。这项工作是向现实世界的光计算迈出的有希望的一步，支持人工智能中的各种应用。

通用人工智能（artificial general intelligence，AGI）在快速发展的同时，对计算性能的要求也在不断提高。对于现实世界中复杂的多模态信息，迫切需要高容量、高通量的计算体系结构。在后摩尔时代，不断要求更高的性能变得具有挑战性。使用电子设备（例如GPU）进行高级人工智能模型的计算与饱和能效相关，这对于支持现代AGI是不可持续的。追求计算性能和能源效率之间的平衡，是高性能计算研究的一个持久目标。

光计算（Photonic computing）提供了前所未有的光速低功耗计算，引起了人们越来越多的关注。光子的高并行性可以促进基本图像运算、储备池计算、神经网络等。然而，目前的集成光计算，特别是光神经网络（ONN），通常由数百到数千个参数和数十个可调参数组成，只能完成简单的基本任务。尽管光集成电路具有空间紧凑性和能效的优势，但它仍然受到不可避免的时变误差的限制，提供有限的网络规模和计算能力，难以支持现实世界的AGI任务

为了支持现代AGI，该研究设计了基于集成衍射干涉异构设计和通用分布式计算架构的大规模光芯片——太极，该架构具有上千万个神经元的能力，实现160万亿次/秒·瓦（TOPS/W）的通用智能计算。

太极光芯片在实验中实现了芯片上1000个类别级别的分类（在1623类别的Omniglot数据集上准确率为91.89%）和高保真的人工智能生成的内容，效率提高了两个数量级。

太极光芯片为大规模光计算和高级任务铺平了道路，进一步开发了现代AGI光子学的灵活性和潜力。在如今大模型通用人工智能蓬勃发展的时代，该研究成果以光子之道，为高性能算力探索新灵感、新架构、新路径。

化“深”为“广”：分布式广度光计算架构

两仪一元：干涉-衍射融合计算芯片

太极光芯片的计算能效超现有智能芯片2-3个数量级，将可为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。预计太极光芯片将跟上现代AGI对计算资源需求的快速增长。

论文链接：

https://www.science.org/doi/10.1126/science.adl1203