打破与解耦 Chiplet技术让AMD成功高性能计算与主机畛域振兴

扭转企业命运的前沿技术

本期Kiwi Talks 将讲述Chiplet技术是如何扭转了一家企业的命运并逐渐实如今高性能计算与数据 中心 畛域的振兴。

当咱们敢于承当可控的危险、踊跃寻求扭转环球的前沿技术时,才会越来越好。

——AMD 董事会主席及首席口头官 Lisa Su 博士

开局:Why Chiplet?

2017年关于AMD 公司 来说是一个十分关键的转机点。在那之前的10年,AMD都面临着微弱的竞争对手,蹩脚的财务累赘。 那一年AMD成功了打破式的翻新,以全新的Chiplet架构降生 EPYC第一代 处置器 ,标记着AMD在高性能计算畛域的振兴,也是其在主机市场上的关键里程碑

回忆2017年,Global Foundries 从AMD剥离,这象征着公司从一家领有晶圆厂的公司变成 芯片 设计公司。

在被问及能否由于晶圆协定才自愿选用Chiplet赛道时,首席口头官Lisa Su回应的答案:“齐全不是,咱们过后的想法是,咱们须要为处置器市场带来一些异乎寻常的物品,因此制造这些良率不高、多少钱低廉的巨型芯片并不是大家想要的答案。”

source:ieeetv

第一代EPYC Zen-1架构的主机 产品 是由4个雷同结构的Die(都含有计算核、内存和I/O性能,I/O关键包括PCIe、 以太网 、片间互连等)经过 IFOP(Infinity Fabric on Package,一种片内互连物理层技术)相连而成。 只管过后AMD的Chiplet设计取得商业化成功,优化了CPU的市场份额,但Chiplet的技术开展不时面临着各种应战。固然,第一代产品全体的设计与制造降落了老本,驳回的2D MCM设计改善了产品性能并参与了灵敏性,但是参与芯片数目确会造成更大的片上系统(soc),由于组件之间的距离变大,造成了产品性能的提前。

在7,8年前,要寻觅到最适合的衔接小芯片的封装技术也雷同面临难题。这是一个复杂的等式,触及老本、性能、带宽密度、功耗和制造才干。

在过后,少量量、低老本地消费它们和领有封装工艺技术是两码事。 为了保持Chiplet的路线,AMD在制造工艺方面投入了少量的资金。

同年,NVIDIA开创人兼CEO 黄仁勋 在2017年Compux颁布了 Tesla V100,号称是当年史上最强的减速器。只管 Tesla V100 在性能上极端低劣,但仍存在不少缺陷。比如芯片面积过大——高达 815 平方毫米,而过大的芯片面积,加上 英伟达 在该款芯片上巨额的研发投入(约30亿美金)间接造成 Tesla V100 的多少钱意外低廉,售价高达 14.9 万美元。如此高的售价让很多用户望而生畏。这也印证了随着芯片面积的增大,制形老本越发低廉,后续行业纷繁为了成功降本都转向了Chiplet的设计架构。

进阶:I/O Die架构的降生

Central I/O Die 的架构,成功地提高处置器性能的同时,也提供了更高的能效比和更好的老本效益。

2018年AMD颁布了下一代Zen 2 EPYC CPU。Zen 2架构的EPYCe 包括8个CCD(Core Chiplet Die)和1个IOD(I/O Die),CCD中包括CPU**、缓存,后者包括各类 控制器 和输入输入处置器使,经过Infinity Fabric技术成功Chiplet之间的高速衔接,从而构建出具备少量**的高性能处置器。这种设计准许每个**芯片领有独立的L3缓存,并且可以独立地启动性能裁减和优化。

source:ieeetv

AMD后续推出的Zen3和Zen 4 EPYC CPU均沿用了I/O Die 的架构,成功地在提高处置器性能的同时,也提供了更高的能效比和更好的老本效益。

AMD的Zen3/ Zen4架构CPU,驳回CCD(compute)和CIOD(memy interface + I/O)组合的方式启动不同Chiplets性能 拆解 。AMD Zen 4 EPYC 驳回12个CDD+1个IO Die的方式,每个CDD蕴含12个**,从而让其到达了96**的设计。

目前,IO Die架构逐渐成为Chiplet干流的一种外形被运行。例如Huawei Lego架构驳回的是compute die(compute + memory interface)和I/O die组合的方式,不同的Chiplets的数量和组合方式都可以灵敏搭配,从而组合出多种不同规格的云端高性能处置器产品。

奇特摩尔作为国际首批自研I/O Die互联芯粒的公司,其2.5D通用IO Die互联芯粒集成了如D2DDDRPCIeCXL等少量存储、互联 接口 ,最高可以支持10+Chiplets,提供更好的性能、更高的带宽、更低的提前及功耗,构建环球上游的一流算力平台。

振兴:高性能计算和数据中心市场

“咱们十分注重高性能计算和 人工智能 的 GPU 开展。实践上,这或许是咱们开启的一个十分关键的弧线,咱们不时都在钻研 GPU,这是下一个严重时机。AMD的chiplet 战略可以构建一个高度模块化的系统,可称之为集成的 CPU 和 GPU,或许说它更像是成功了人们须要的令人难以置信的 GPU 性能。”Lisa Su在接受外媒访谈时示意。

正如Lisa形容的一样,AMD这几年聚焦于HPC和数据中心并交出了斐然的效果单。2020年, AMD官宣推出Instinct MI 100 减速卡片面进军高性能计算畛域。在接上去的几年中,AMD不时更新其减速卡的性能。

2023年,AMD又推出了高性能GPU减速卡即Instinct MI300. Lisa 坦言AMD将AI视为第一战略重点,AI存在少量的市场时机,而最大时机来自数据中心。MI300系列已成为AMD历史上支出增长最快的产品。Instinct MI300 是 AMD 建设未来数据中心/ HPC级APU 的关键规划,结合了 AMD 的 CPU 和 GPU 技术的好处。

值得留意的是,AMD从Zen3 架构开局就成功了3D fabric封装工艺,而I/O die作为系统基础设备的一局部,经过AMD Infinity Fabric技术与其余芯片启动互连,施展着关键作用。在某些性能中,例如顶配版本,或许会蕴含4个I/O die,它们基于6nm工艺制造,并且或许蕴含I/O控制器、IP块以及或许的缓存。

3D Base die(可了解为基于3D封装的I/O Die)较2.5D IO die面积更大,除了IO die中的互联模块,还可以把原本集成在SoC中的Power、S、I/O等非数字性能模块拆分并拼搭出来,从而形成一个高度集成并节能的多核异构计算架构,同时成功下层的逻辑芯片面积最大化和芯片单位面积的最小化。在互联方面,3D Base die支持水平方向和垂直方向的异构芯片互连。垂直方向,经过TSV、microbump等3D互连技术与顶层逻辑芯粒、strate垂直 通讯 ,从而以最小限制成功die与die之间的互连、片外衔接,清楚提高芯粒集成密度。

Kiwi Base Die 是奇特摩尔基于Chiplet及3D架构所自研的基础互联芯粒。Kiwi Base Die 以高性能片上 网络 Kiwi Fabric 为互联**,整合了PCle、HBM等高速互联接口,并搭配大容量的片上近存,可成功高效的片内数据传输调度与存储。客户可将其余性能单元垂直重叠在Kiwi Base Die之上,经过 3D Die2Die 接口成功芯粒间的高速互联。

打破解耦:开源的芯环球

AMD Lisa Su在采访中标明“ 假设你看看当天的 半导体 行业,你会发现咱们和竞争对手既有竞争的中央,也有协作的中央。 行业没有一种万能的处置打算,因此模块化和开放性将准许生态系统在他们想要翻新的中央启动翻新 。所以,比如 英特尔 ,咱们确真实某些畛域竞争,但咱们也在某些畛域协作。英特尔是 UALink 联盟的一局部,他们也是超级以太网联盟UEC的一局部。”

AMD作为上游的国际芯片公司,提倡行业的开开放源,经过联结生态同伴建设国际互联规范。

“目前国际的Chiplet生态处于‘半开放生态’;一是少量产品开局驳回Chiplet技术,二是行业中降生了一些专门从事Chiplet的企业,无论是提供特定芯粒,还是将已有芯片产品中的某些性能模块(芯粒)独自分别出来,以独立的Chiplet方式提供应其余企业经常使用。奇特摩尔就在此列。”奇特摩尔联结开创人兼产品和处置打算副总裁祝俊东此前在接受第一财经采访时提及。

未来 科技 还会出现很多有幻想有保持的企业如奇特摩尔,依托Chiplet架构,不时探求下一代高性能计算及AI网络的互联芯粒技术。

写在最后

摩尔在其 1965 年关于芯片、 晶体管 以及芯片设计未来的开创性论文中写道,他最终能够预感到 芯片制造 商将芯片合成成更小的局部,以使它们更容易制造。这也是半导体鼻祖关于未来芯片架构的一个神奇的预测,也将预示行业对Chiplet技术赋予厚望,从而发明一个更便捷、更开源的芯环球。

原文题目:Kiwi Talks |打破与解耦:Chiplet技术让AMD成功高性能计算与主机畛域振兴

© 版权声明
评论 抢沙发
加载中~
每日一言
不怕万人阻挡,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender