首页 > 科技 >

“专用的通用芯”,深鉴科技听涛AI芯下半年问世(2)

2018-06-12 04:28:39 网络整理 阅读:171 评论:0

随着摩尔定律的放缓与海量数据的爆发,巨头纷纷从通用计算..转向定制化..,微软借助FPGA发力、谷歌打造TPU..。在追求更好性能的同时,不同应用场景对AI硬件提出不同的需求,主要为功耗、响应时间以及成本三方面,比如安防监控应用要求功耗小于5W,自动驾驶应用对实时性提出较高要求。

针对以上需求,深鉴科技采取优化计算引擎、优化访存系统、利用神经网络稀疏性的软硬件协同优化的技术方案。

据悉,深鉴科技一直在深度压缩技术优化算法上进行探索,其深度压缩工具DECENT融合了剪枝、量化等压缩技术,可以在保证算法精度的前提下,对计算模型进行压缩。神经网络编译器DNNC将训练后经过DECENT压缩的神经网络模型映射为DPU上高效执行的优化指令流,DNNC实现从算法到深鉴自定义机器代码的映射。因此,可降低系统访存带宽及功耗需求。

深鉴DPU采用与GPU相同的并行计算。GPU擅长海量的并行运算,比如在云端训练出一个复杂的深度神经网络模型,而此工作目前只有英伟达的GPU集群、Google TPU等胜任。据介绍,深鉴DPU主打轻量化并行架构,以8比特为主要的运算单元,可实现更低功耗、更快响应时间,更低功耗等同为客户带来更低成本。

据陈忠民介绍,,深鉴主攻数据中心、安防监控、自动驾驶三大业务。数据中心业务是深鉴最初发力的方向,并有一些成功的合作案例。2017年后在安防监控与自动驾驶领域的业务上投入了更多的精力。

相关文章