“专用的通用芯”，深鉴科技听涛AI芯下半年问世(2)

2018-06-12 04:28:39 网络整理阅读：171 评论：0

随着摩尔定律的放缓与海量数据的爆发，巨头纷纷从通用计算..转向定制化..，微软借助FPGA发力、谷歌打造TPU..。在追求更好性能的同时，不同应用场景对AI硬件提出不同的需求，主要为功耗、响应时间以及成本三方面，比如安防监控应用要求功耗小于5W，自动驾驶应用对实时性提出较高要求。

针对以上需求，深鉴科技采取优化计算引擎、优化访存系统、利用神经网络稀疏性的软硬件协同优化的技术方案。

据悉，深鉴科技一直在深度压缩技术优化算法上进行探索，其深度压缩工具DECENT融合了剪枝、量化等压缩技术，可以在保证算法精度的前提下，对计算模型进行压缩。神经网络编译器DNNC将训练后经过DECENT压缩的神经网络模型映射为DPU上高效执行的优化指令流，DNNC实现从算法到深鉴自定义机器代码的映射。因此，可降低系统访存带宽及功耗需求。

深鉴DPU采用与GPU相同的并行计算。GPU擅长海量的并行运算，比如在云端训练出一个复杂的深度神经网络模型，而此工作目前只有英伟达的GPU集群、Google TPU等胜任。据介绍，深鉴DPU主打轻量化并行架构，以8比特为主要的运算单元，可实现更低功耗、更快响应时间，更低功耗等同为客户带来更低成本。

据陈忠民介绍，，深鉴主攻数据中心、安防监控、自动驾驶三大业务。数据中心业务是深鉴最初发力的方向，并有一些成功的合作案例。2017年后在安防监控与自动驾驶领域的业务上投入了更多的精力。