首页 > 科技 >

Cascade Lake全家福:图说第二代至强可扩展处理器

2019-04-04 00:10:22 暂无 阅读:1094 评论:0
Cascade Lake全家福:图说第二代至强可扩展处理器

今天,英特尔(Intel)正式推出由傲腾数据中心级持久内存加持的第二代至强可扩展处理器(Xeon Scalable Processor,XSP)家眷,对应在宁靖洋两岸近乎同步召开的“以数据为中心”(Data-Centric)发布会主题。

代号Cascade Lake(CLX)的第二代至强可扩展处理器能够视为前代产物(代号Skylake,SKL)的完美版,架构和工艺都没有显着的改变。在这种情形下,从3开首的铜牌(Bronze)系列到8开首的铂金(Platinum)系列,除了后背的数字从1酿成2(第一代和第二代),最常见的转变是基频(Base)和睿频(Turbo)有100~300MHz的提高,内到互联架构与最高28核56线程、外到6通道DDR4和48条PCIe,都与初代连结一致。

新增的至强铂金9200系列是个破例。

氪金玩家的Platinum 9200

,之后的一个月内我写了几篇产物和架构解析的文章。在一文中,我奚弄至强可扩展处理器从铜牌、银牌、金牌到铂金的定名系统或者是受了80 PLUS电源认证系统的开导,并预言“跟着至强可扩展处理器TDP的进一步上升,将来会显现雷同Titanium 92xx如许的产物”……

如今看来,展望对了一半:切实增加了9200系列,但仍在铂金旗下,并没有多出一个钛金。

要懂得Platinum 9200系列,有需要简洁回首下始于Skylake、被Cascade Lake延用的6×6 Mesh架构。

Cascade Lake全家福:图说第二代至强可扩展处理器

这个共36个节点的网格构造,上面一排共6个用于UPI(CPU之间)和PCIe(外部设备),摆布双方各1个用于3通道DDR4内存掌握器(可达DDR4-2933,Skylake为DDR4-2666),留下最多28个节点用于处理器焦点,所以Cascade Lake-SP(Platinum 8200及以下)和Skylake-SP都无法跨越28核56线程。

Platinum 9200的代号是Cascade Lake-AP,即Advanced Performance(增加机能)的缩写,响应的SP代表Scalable Performance(可扩展的机能)——能够懂得为“通俗版”。

Cascade Lake-AP在2018年11月初放出新闻时,只有48核,为2个24核die的MCM(MultiChip Module,多芯片模块)封装。但在正式发布的产物家眷中,48核的Platinum 9242只能排在第二档,上面还有56核的Platinum 9282——相当于把2个28核的顶级款Cascade Lake-SP给“粘”在了一路。

Cascade Lake全家福:图说第二代至强可扩展处理器

9200的双路(2S)相当于8200的四路(4S)

“胶水”的具体实现简洁粗鲁。9200系列支撑双路设置,意味着4个die(每个die能够懂得为1个Cascade Lake-SP)要彼此互连。以铂金8000系列(以及金牌6000系列)的3个UPI,是支撑4个CPU之间全网状保持(full-mesh)的,即随意两个die之间都有直接的UPI保持。如许一来,每个die对外有2个UPI,每个9200系列处理器对外就有4个UPI。

Cascade Lake全家福:图说第二代至强可扩展处理器

经由这种直接的1+1=2,9200系列的最大内核数量、每处理器支撑的内存通道数量都达到了8200/8100系列的两倍,在某些应用中也获得了近乎两倍的机能提拔(9282 vs. 8180)。TDP(Thermal Design Power,热设计功耗)亦同步增进,最低的922x为250瓦(W),9282则高达400瓦——若是不是主频有所降低,达到410瓦(8280的两倍)也是很有或者的。

如斯高功率的CPU对办事器的散热提出了很高的要求。以陪伴Platinum 9200系列推出的Intel Server System S9200WK家眷办事器产物为例,有1U半宽和2U半宽两种节点,前者必需使用冷板式液冷,后者可选风冷,但仅支撑到350瓦(的9242)。

Cascade Lake-SP概览

不算“开胶”(对应“开挂”)的4款Cascade Lake-AP,我们如今能看到的Cascade Lake-SP,共有43个公开的型号(SKU),比Skylake-SP最初发布时精简了8款——因为加上了后来推出的Gold 6138P,第一代至强可扩展处理器公开的型号多达52个。

改善的14nm制程(14nm++),在31款换代产物(即型号仅第二位由1酿成2)中最为遍及的收益是200~300MHz的主频(基频和睿频)提拔,有些核数多了2~4个,还有些LLC(Last Level Cache,末级缓存)的容量获得了少量增加;逾七成(22款)TDP连结不变,另9款TDP有分歧幅度的上升。

支撑的内存频率也从DDR4-2666提高到DDR4-2933,不外,内存方面最大的改变还数从Skylake时代延至Cascade Lake时代的傲腾数据中心级持久内存。

Cascade Lake全家福:图说第二代至强可扩展处理器

Optimized for highest per-core scalable performance

傲腾数据中心级持久内存即Intel Optane DC Persistent Memory,中英文都长到拗口,好多大英的员工也记不住。所以尽管2018年5月底就发布了这个正式名称,好多人仍然甘愿以之前的代号“Apache Pass”或其简写“AEP”称谓它。固然我一度对Apache Pass怎么会简写为AEP感应接管不克,但在正式名称出来后,我也感觉照样代号更简练易记。

为了论述轻易,下面我们会用“DCPMM”的简写来指代Optane DC Persistent Memory Module(傲腾数据中心级持久内存模块)。后背这个名字固然更长,但的确较为正确的解说了这是一种什么产物——用在办事器等数据中心级设备中的NVDIMM。

Cascade Lake全家福:图说第二代至强可扩展处理器

自下向上,依次是64GB DDR4内存(DRAM)、256GB和512GB的Optane DCPMM,后者在外观上与加装散热片的DDR4内存没有两样

NVDIMM即Non-Volatile DIMM,能够通俗懂得为不需要连结通电即可持久存储数据(非易失性)的内存条。闪存(如Flash NAND)等固态存储手艺就是非易失性的,并且还比“正经内存”(DRAM)容量大、单元单子价钱低,做成内存条的外形(DIMM)插到办事器的内存插槽上,能够作为“正经内存”的增补(或许廉价替代品)。

不外闪存的机能照样比DRAM差太远,延迟高几个数量级,写入尤其慢,更要命的是写入寿命有限,总之是各类不耐写。英特尔在2015年发布的傲腾(Optane)品牌基于3D XPoint手艺,延迟只比DRAM高一个数量级,读写机能平衡,写入寿命也比闪存高得多,相较于作为固态盘(SSD),NVDIMM是其更为幻想的使用场景。

Optane DCPMM硬件上是内存条的形态,需要和DRAM合营使用,即每个内存通道的2个DIMM槽上,离CPU更近的槽插Optane DCPMM,另一个槽留给DRAM。软件方面,有两种使用模式:内存模式不需要软件应用进行点窜,App Direct模式则需要软件应器具备持久内存(PMEM)感知能力,各有利弊,留待今后专文另述。

Cascade Lake全家福:图说第二代至强可扩展处理器

内存模式面向传统工作负载,App Direct模式则需要应用软件进行针对性的优化

支撑傲腾数据中心级持久内存是铂金(8200系列)和金牌(6200&5200系列)相对前代产物的一大卖点,个中6款还有大型(可达4.5TB)和中型(可达2.0TB)DDR内存层支撑可选。

与前代一般,第二代至强可扩展处理器的通用产物分为两大类,一类是为最高每核“可扩展机能”优化,另一类直接是“可扩展机能”(scalable performance),姑且认为对应第一代的“Balanced, energy efficient perf/W”。

Cascade Lake全家福:图说第二代至强可扩展处理器

Scalable Performance

这里面值得一提的是Gold 5217,与Silver 4215都没有公开的前代型号。Gold 5117是百度定制的型号,从非官方信息来看,除了105瓦的TDP,其他首要参数都与Gold 5217有着较为显着的差别,似无直接关系。

5类后缀与工作负载优化

在评介Skylake的系列文章里,已经指出新的型号定名划定将严重依靠4位数字后背的2位字母“处理器选项”。第一代至强可扩展处理器有4种处理器选项,离别是M、F、T、P,在这一代M(每插槽1.5TB内存)被L(4.5TB)和M(2.0TB)所庖代,F(Fabric)和P(FPGA)看似后继无人,只有T不变,又加上了N、S、V和Y。

Cascade Lake全家福:图说第二代至强可扩展处理器

Long-life cycle and NEBS-thermal friendly

T:长生命周期与NEBS热友好

T的注释是Thermal & long-life cycle support,首要针对长生命周期和NEBS较高工作温度的要求,除了电信(Telecom)行业,还可用于工业主动化(如IoT)和航天等运行情况较为严苛的范畴。与前代比拟,型号由9款减至5款,没有铂金版,3款金牌版(没有5118T)提拔了核数与LLC容量,有3款的TDP指标比不带T的版本有所降低,与前代连结一致。

新增的4种后缀,则加倍明确了所针对的行业应用场景,离别为特定的工作负载优化,稀奇是解决云较量时代,多个应用共享资源的情形下,若何包管SLA的问题。

Cascade Lake全家福:图说第二代至强可扩展处理器

VM density value specialized

V:VM密度专用

加V的只有2个型号,在核数相当的产物中TDP最低,差距最小也有10瓦,很大水平上得益于它们不到2.0GHz的基频。这意味着它们能够在一致(功耗)开销下,获得更高的虚拟机(VM)密度。

Cascade Lake全家福:图说第二代至强可扩展处理器

Featuring Intel Speed Select Technology (3 in 1)

Y:可变的核数与频率

Cascade Lake全家福:图说第二代至强可扩展处理器

Networking/NFV specialized

N:收集/NFV专用

这3款CPU看起来也是“平平无奇”,至多在频率和TDP上与不带N的版本有些收支,实则同样支撑SST手艺。每款CPU的焦点能够被动态的分为尺度优先级和高优先级,具有分歧的基频(SST-BF),以知足分歧性质的网元对机能的差别性要求,无需改写代码即可提拔要害应用的机能。

Cascade Lake全家福:图说第二代至强可扩展处理器

从上图中能够看出,三者标称的基频都是2.3GHz,然则尺度优先级的基频均为2.1GHz,高优先级的基频为2.7GHz或略高。

Cascade Lake全家福:图说第二代至强可扩展处理器

Search application value specialized

S:搜刮专用

从V/Y/N后缀的产物中能够看出一些定制的思路和手艺,然则真正为具体客户定制的产物不会公开,Google和百度的定制版本也不会显现在这里。5220S面向小一些的搜刮公司(如Yandex)或其他公司中的搜刮应用,频率相对较高,以降低搜刮延迟,但并不是所有搜刮公司的买卖需求都是如斯。

One more thing……

NV并施按摩店,周全上线英特尔。大英化解挑战的对策是周全出击,第二代可扩展处理器还增加了DL Boost和VNNI(Vector Neural Network Instruction,矢量神经收集指令)等功能,以加快AI应用的机能。不外,这些早已不是机要,我们更为等候的产物生怕是——

Cascade Lake全家福:图说第二代至强可扩展处理器

— END—

相关文章