首页 > 科技 >

Intel 10nm十代酷睿改造转战M.2:神经网络推理

2019-08-21 18:20:28 暂无 阅读:1065 评论:0

Intel 10nm Ice Lake十代酷睿处理器,但它可不光仅会用于轻薄笔记本,将来还会上岸办事器,而在两个月前以色列海法(Intel主要研发基地),Intel还展示了一款基于10nm Ice Lake打造的Nervana NNP-I(神经收集推理处理器),但采用了M.2样式。

Hot Chips 31芯片大会上,Intel首次发布了这款特别产物的架构细节。

Intel 10nm十代酷睿改造转战M.2:神经网络推理

这是10nm Ice Lake十代酷睿处理器

Intel 10nm十代酷睿改造转战M.2:神经网络推理

这是基于Ice Lake革新的M.2 NNP-I

在无处不AI(AI Everywhere)的指导思惟下,Intel正在研究各类各样的AI软硬件方案,包罗CPU、GPU、FPGA、ASIC等等。

这款新的NNP-I代号为“Spring Hill”(温泉山丘),面向数据中心范畴的轻度AI推理工作,能做成M.2扩展卡恰是得益于10nm芯片的超小面积。

在原有10nm Ice Lake处理器的根蒂上,Intel拿掉了两个CPU较量焦点、GPU核芯显卡,同时到场12个推理较量引擎(ICE),彼此基于硬件同步,同时每个ICE有本身的4MB SRAM缓存来削减数据转移,而且和两个CPU焦点共享一致性互连、24MB三级缓存。

Intel 10nm十代酷睿改造转战M.2:神经网络推理

Intel还设计了一个深度进修较量网格(DL Compute Grid),作为张量引擎的它经由数据和掌握总线与SRAM、VP6 DSP互连,支撑FP16、INT8、INT4、INT2、INT1等类型把持,个中DSP还能够处理一些特别的算法。

Intel 10nm十代酷睿改造转战M.2:神经网络推理
Intel 10nm十代酷睿改造转战M.2:神经网络推理

CPU焦点仍然是尺度的Sunny Cove架构,支撑AVX-512、VNNI指令集,可加快卷积神经收集,而完全继续的FIVR电压调节器可动态调整功耗,优先知足最需要的硬件单元。

内置两个LPDDR4X内存掌握器,整合封装一颗内存芯片与之合营,传输带宽4.2GT/s(68GB/s),并支撑带内ECC,但容量未发布。

NNP-I与系统的通信通道走的是PCIe 3.0 x4或许PCIe 3.0 x8,带宽不是事儿,但没有效NVMe和谈,只是尺度的PCIe界面。

Intel 10nm十代酷睿改造转战M.2:神经网络推理

TDP功耗非常天真,低可至10W,高可达50W,完全视机能需要而定,作为扩展卡也不受M.2 15W的限制。凭据分歧功耗设置,INT8整数能效在2-4.8TOP/s局限内。

Intel透露,10W TDP功耗下跑ResNet500,每分钟推理数可达3600,等于效率高达4.8TOP/s,照样相当高的。

Intel 10nm十代酷睿改造转战M.2:神经网络推理
Intel 10nm十代酷睿改造转战M.2:神经网络推理

软件方面,Intel会供应响应的斥地对象,匡助负载将推理工作完全转移到加快器上,完成后再通知至强CPU进行下一步处理,从而使得至强CPU不再需要经由PCIe总线和其他加快器彼此通信、转移数据,大大节约较量资源和功耗。

Intel NNP-I今朝已经试产,将在岁尾投入规模量产并出货,并且后续还有两代新品正在设计中……

Intel 10nm十代酷睿改造转战M.2:神经网络推理
Intel 10nm十代酷睿改造转战M.2:神经网络推理

相关文章