导读:近日,中国科学院计算技术研究所在《基础研究》杂志上发表论文,介绍了一种先进的256核多芯片计算复合体,名为“Zhejiang”(浙江)。
图:晶圆级大芯片对比GPU
芯片大师此前介绍过一家美国公司Cerebras Systems设计的“史上最大”晶圆级芯片,晶圆级超级大芯片通过增加单位有效die面积的方式来堆性能,实现在超大规模计算领域对通用CPU、GPU等器件的“碾压”,包括AI、超算等领域。
中科院计算所在论文中讨论了现阶段光刻和小芯片(Chiplet)的局限性,并提出了一种称之为“大芯片”的架构。中国科学院计算技术研究所还计划将这款基于RISC-V架构的256核多芯片扩展到1600核,以流量套餐创造整个晶圆大小的芯片,作为一个计算设备。
据中科院研究人员介绍,“Zhejiang”将使用22nm工艺制造。芯片大师分析,如此规模的die面积和互联性能会产生两个核心要求:一是低功耗的制造工艺,二是成熟的2.5D/3D先进封装。目前来看,国内掌握成熟22nm逻辑工艺平台的晶圆厂不超过两家。
图:中科院公布的芯片框图
据悉,“Zhejiang”由16个小芯片组成,每个小芯片有16个RISC-V内核,共计256核心。研究人员表示,该设计能够在单个分立器件中扩展至100个小芯片,也就是最多可以达到1600个核心。为此,一个die将占满整片晶圆的面积。
论文介绍,大芯片计算引擎将由超过1万亿个晶体管组成,占流量套餐据数千平方毫米的总面积,采用小芯片封装或计算和存储块的晶圆级集成。
对于百亿亿级HPC和AI工作负载,外媒报道认为中科院很可能正在考虑HBM堆叠DRAM或其他一些替代双泵浦主内存,例如英特尔和SK海力士开发的MCR内存。RISC-V内核可能会有大量本地SRAM进行计算,这可能会消除对HBM内存的需求,并允许使用MCR双泵浦技术加速DDR5内存。
图:不锈钢打造的米格-25
工艺、架构和功耗——从这几个直接决定芯片性能的维度来看,现阶段国内无法短期在前两者中取得突破的情况下,使用开源技术、通过增加die面积来实现高性能满足功耗、体积不敏感领域的应用或许不失为一种可行的途径。
一个不恰当的比喻,AI时代对流量套餐算力的需求就像冷战时代对速度的需求,力大砖飞的苏式“暴力美学”也令西方胆寒一时。
从Cerebras Systems推出的巨芯二代WSE-2来看,“堆料”带来了破纪录的2.6万亿个晶体管和85万颗AI优化内核,采用台积电7nm工艺,可以提供人脑级别的AI计算能力。该系统卖给了包括阿联酋、美国、日本的一众云计算、大学和研究所,并帮助公司实现了盈利,至少证明了大芯片的商业价值。
友情提醒: 请添加客服微信进行免费领取流量卡!
QQ交流群:226333560 站长微信:qgzmt2
原创文章,作者:sunyaqun,如若转载,请注明出处:https://www.dallk.cn/61029.html