当前位置:首页 > 工业用地 >服务器多核处理器(1核服务器)

服务器多核处理器(1核服务器)

说到核心制造,不仅手机、汽车厂商热衷于此,现在服务器厂商也在投入自研。无论是国内的阿里云还是国外的亚马逊,都在收购大量的芯片设计厂商。一批芯片设计师成为精英后,也开始推出基于自家芯片的服务器,并且采用的工艺已经升级到7nm、5nm。

此外,第三方服务器芯片厂商也在顺势而为,有意为这些云服务厂商提供更高的吸引力,而不是让他们想着节省成本,用自研的解决方案替代自己的产品。幸运的是,大多数云服务厂商的自研芯片主要集中在AI加速芯片和网络芯片上,CPU很大一部分仍然是第三方的领域。在第三方CPU设计中,我们可以看到多核已经成为当前的主流方案。

服务器多核处理器(1核服务器)

多核云更受欢迎吗?

首先,我们来看看提高性能最常见、最直接的方法——堆核心。我们在消费芯片或者各种电子产品的宣传术语中都听到过这种操作,它一直是一种非常有效的提升性能的方法。虽然芯片面积有比较大的限制,但不可否认的是,在面积不那么看重的服务器市场,走多核路线的芯片厂商越来越多。

AmpereComputing的AmpereAltra应该是国内出货量最高的Arm服务器CPU系列。这款多达128核的处理器已在多个云服务实例中亮相。安培计算已与微软Azure、Oracle Cloud达成合作。在中国,它不仅拥有阿里云、腾讯云、京东云、UCloud等公有云客户,百度、美团、字节跳动等公司也在使用其产品。

AmpereAltraMax 封装/AmpereComputing

我们来看看NVIDIA的ArmCPU Grace。虽然采用了Arm的Neoverse参考设计,但NVIDIA也选择了144核的多核设计。那么为什么多核在服务器上如此受欢迎呢?上面我们也提到AmpereAltra在中国获得了很大的市场。事实上,归根结底是由于其多核数量。

中国使用公有云的用户数量远远超过国外。对于云服务厂商来说,这种多核处理器意味着单个服务器可以划分为更多的vCPU,这意味着更多的可用实例。这还没有结束。以AmpereAltra为例,每个核心上仅运行单个线程,因此即使多个用户同时使用,仍然可以保持稳定的性能。

Ampere 处理器路线图/AmpereComputing

值得一提的是,Ampere近期发布了自主研发的5nm处理器AmpereOne,这是一款基于其自研Arm内核的服务器处理器。这对于其他厂商来说或许是不可能的,但作为Arm架构的授权商,Ampere可以像高通、华为、苹果等厂商一样开发定制自己的Arm内核。

也许是因为这次终于停止使用ArmNeoverseN1或N2这样的参考设计,Ampere将这款产品命名为AmpereOne。 Ampere尚未公布这款产品的核心数,但从设计上可以推断,现有产品的最小核心数为32核,而AmpereOne的实物图与AmpereAltraMax的封装类似,可以推断该新产品必须追求更高性能的云原生应用程序,而不是针对需要更少核心数量来满足需求的边缘计算市场。

服务器AI芯片以数量和能耗取胜

与处理通用计算的处理器芯片的多核策略不同,AI芯片的多核策略主要是为了提高AI计算效率,单核能效比和单位面积效率往往高于传统处理器架构,从而产生更多的核心。以打造千核RISC-V AI芯片的Esperanto为例。其ET-SoC-1芯片基于台积电7nm,集成1092个RISC-V内核。

ET-SoC-1芯片/世界语

但即便是这样的千核芯片,也能实现20W以内的功耗和570mm2的柴油机尺寸。正因为如此,即使单个ET-SoC-1 的计算能力不如NVIDIA A100 等GPU,但使用多个芯片组成的AI 加速板仍然可以达到相同的性能,或者甚至显着降低功耗。

对于依赖阵列乘法器和少量CPU核心等专用硬件的芯片来说,一旦出现专门硬件无法完全解决的问题,任务就会交给有限的通用CPU核心。在Esperanto的ET-SoC-1解决方案中,数千个通用RISC-V内核带来的完全并行性可以显着加快执行速度。更重要的是,即使相比5nm,7nm的能效比仍然非常出色,因此更适合这种拥有大量核心的设计,也更符合低碳设计理念数字中心。

结论

有些读者可能会感到困惑。既然多核可以给服务器芯片带来显着的提升,那么为什么英特尔或AMD等x86服务器芯片制造商不设计100个以上核心的架构呢?这与CISC和RISC架构的区别有关。即使在相同工艺和相同核心数量的情况下,x86芯片的diesize也绝对大于Arm和RISC-V芯片。随着芯片尺寸的增大,芯片的良率也会提高。一起减少。另一个问题是多核下的并行问题。一些通用计算任务在多核下的并行执行效率不高,复杂度会大大增加。

最新资讯

推荐资讯