以前谈及芯片,基本上技术突破都是来自欧美日韩这些个国家!可现在时代不一样了,中国这几年在芯片领域取得了重大突破,为全球芯片产业作出了巨大的贡献。

媒体爆料:中国成功研制全球首款基于相变忆阻器的神经动力学系统芯片!那么问题来了,这款芯片的意义在哪里?

打开网易新闻 查看精彩图片

芯片是怎么做到的?“缺陷”变成了“武器”

他们用的不是传统晶体管,而是一种叫相变忆阻器的器件。这东西有一个独特的物理特性。“电导漂移”。

通俗讲,相变存储器的电导会随时间变化,而且这种变化是可以预测、可以精准调控的。在过去的芯片设计里,这种“漂移”被认为是一种缺陷,工程师想方设法要消除它。但杨玉超团队反其道而行之——既然它漂移是有规律的,那我能不能用这个规律来干活?

答案是:能。

他们把神经动力学系统中最耗时的“自适应步长搜索”,直接编码为器件的物理电导演化过程。原本需要复杂数字电路反复执行的运算、缓存访问、数据搬运,现在交给了器件自身的物理规律去“跑”。

用通俗的话说:以前是“搬着数据去计算”,现在是“数据在原地自己算”。不需要来回搬运,不需要反复读写,直接在存储单元内部完成计算。

这就是“可控存内计算”的核心思想。

更妙的是,团队还将神经网络的权重映射到相变存储器的多级电导态上,在同一个阵列内同步完成了矩阵乘加运算。两大核心计算任务被统一集成在总面积仅0.28平方毫米的存算阵列中。

打开网易新闻 查看精彩图片

2.12毫秒,意味着什么?

2.12毫秒,大概是你眨一下眼的几十分之一。

但在这个数字背后,是一组让人头皮发麻的数据对比。

在执行相同神经动力学运算时,这颗芯片较当前最先进的专用加速器(ASIC)速度提升3.82至36.27倍,功耗降低11.75至24.73倍。在脑皮层表面高保真重建任务中,它较英伟达A100 GPU提速高达50.38至478.18倍。

478倍是什么概念?一台A100需要跑478分钟的任务,这颗芯片1分钟就能跑完。用40纳米的老工艺,跑赢了全球最先进的GPU。

这不是靠堆算力堆出来的,是靠改思路改出来的。

这项技术到底能干什么?

很多人看到“神经动力学”这四个字会觉得太遥远。但实际上,它的应用场景离我们并不远。

第一个场景:脑机接口。

脑机接口要实时解析神经状态,必须依赖对连续神经形态和动态过程的快速建模。过去这需要大型计算设备离线运算,跟不上实时需求。现在有了毫秒级的芯片,脑机接口从“离线分析”走向“实时交互”成为可能。

第二个场景:脑数字孪生。

每个人的大脑都是独一无二的。未来,医生可以构建个体化、动态化的脑数字孪生模型,进行术前模拟和个性化诊疗。术中神经导航可以在手术过程中实时呈现脑皮层结构。

第三个场景:神经退行性疾病诊疗。

阿尔茨海默病、帕金森病等神经退行性疾病的早期诊断,一直是个世界级难题。有了能够实时重建脑皮层结构的硬件底座,早筛和个性化干预将获得全新的工具。

杨玉超说,这一突破“为下一代脑机接口、脑数字孪生、神经导航和神经退行性疾病智能诊疗提供了全新的硬件底座”。

打开网易新闻 查看精彩图片

真正值得关注的东西是什么?

坦白说,这颗芯片目前还只是实验室成果,距离大规模商用还有很长的路。但有几个点,我觉得特别值得关注。

第二,40纳米工艺跑赢了先进GPU。在芯片制程被“卡脖子”的大背景下,这条“换道超车”的路径尤其值得关注。它证明了一件事:算力的提升,不一定非要靠更小的制程。换个思路,也能跑出惊人的速度。

第三,它为“后摩尔时代”提供了一种全新的计算范式。摩尔定律正在逼近物理极限,传统芯片的算力增长越来越慢。而“存内计算”这条路线,可能是下一个十年的重要突破口。

杨玉超在接受采访时说,要让机器像大脑那样实时建模和理解物理世界。这个目标听起来很遥远,但他们用一颗拇指大小的芯片证明了再远的目标,只要有人愿意一步一步走,总能走到。

中国人第一次在“神经动力学计算”这个赛道上,跑在了全世界的最前面。这比任何跑分都更能说明问题。