随着制程技术的发展,现在的芯片越做越小。很多人难免会有疑问,明明晶体管的密度越来越高了,为什么不保持一定的体积,提升更多的性能,非要做小呢?

首先是散热问题,如果芯片面积过大,产生的热量也十分恐怖,需要更强力的散热手段,散热不及时会使芯片无法维持稳定的工作状态。其次是成本问题,芯片的制造存在良品率,比如说一片晶圆可以生产100片芯片,但晶圆上出现三个出错点,会损失3块芯片,良品率仍然有97%,如果只生产更大的20个,损坏3个点意味着良品率只有85%,对于企业来说成本剧增。

目前来说芯片的发展趋势是越来越小,台式机的显卡可能就是你能见到的最大的集成芯片了,更强的性能需要依靠多个芯片并行,偏偏有一家公司反其道而行之,生产出了一款怪物级的芯片。

加州的初创企业 Cerebras 推出的一款新芯片WSE,竟然比一块 iPad 还要大。

“我还以为是鼠标垫呢”

这个「硅基巨人」的边长大约有 22 厘米 (大约 9 英寸),可能会成为有历史记载以来最大的计算机芯片。

前面提到过,现代晶圆厂通常会用直径约为 300 毫米、大小约为 12 英寸的晶圆,这种晶圆片通常能生产超过 100 个芯片。而Cerebras 是从 300 毫米的晶圆上切割下来一个最大的正方形做芯片,也就是说,一片晶圆,只能生产一个,不容出错。

这款芯片面积42225平方毫米,是目前芯片面积最大的英伟达GPU的56.7倍,拥有1.2万亿个晶体管,400000个核心,片上内存18 Gigabytes,内存带宽19 PByte/s,fabric带宽100 Pbit/s,专门面向AI任务。

相比之下5W元的Tesla V100小的可怜

这颗芯片拥有史上最大的片上存储空间(英伟达最好GPU的3000倍)、最多的AI核(每一个核相当于一个小型计算机)和最高的通信速度(最高性能GPU的10000倍内存带宽)。

芯片设计人员是用Cadence、新思科技等公司的芯片设计软件来规划晶体管的排列。但传统芯片仅有数十亿个晶体管,而Cerebras芯片的晶体管有1.2万亿,这是一般的芯片设计工具无法实现的。因此,Cerebras建立了自己的设计软件工具。

Cerebras 公司 CEO Andrew Fieldman在一份声明中说,“Cerebras WSE专为AI而设计,其中包含了不少基础创新,解决了限制芯片尺寸的长达数十年的技术挑战,如单晶圆良率、功率输出、封装等。其中,所有架构设计都是为了优化AI工作的性能。总的来说,WSE只需要较小功耗和空间,就能提供数百或数千倍的现有解决方案的性能。”

据他估计,搭载WSE的计算机将是内置多个NVIDIA芯片的服务器的150倍,而功耗只是服务器机架所需物理空间的一小部分。他预测,在云计算设施中运行成本高达数万美元的AI训练任务,有望将成本降低一个数量级。

现在最大的疑问是,这么大一块芯片,散热要怎么做?不得不说,目前为止,各大新闻中都未提及这款芯片的功耗问题。但不难想象,与我们看见的传统“指甲盖”大小的芯片相比,这款芯片的功耗一定不会低。

Andrew也表示,这款芯片不会单独销售,而是将被打包到Cerebras设计的计算机“设备”中。原因是它需要一个复杂的水冷系统去散热。

巨芯有怎样的商用价值?据悉,少数客户将在9月份开始尝试WSE芯片。

市场研究机构 Tirias Research 的创始人 Jim McGregor 也不是很看好这款巨型芯片。他认为,并非所有科技公司都会急于购买像 Cerebras 这样形状非常奇特的芯片。

一方面,他估计 Cerebras 的系统可能就要花费数百万美元,因为现有的数据中心可能需要修改以适应它们的结构。

另一方面,Cerebras 还必须开发软件,使 AI 开发人员能够轻松适应这款新产品。

不过他给出一个有意思的预测——那些赌上性命也要与 Facebook、亚马逊和百度等 AI 公司竞争的大型科技企业,也许会认真研究 Cerebras 这款超大号芯片。这说不定使他们弯道超车的机会。