AI芯片设计要 | '量体裁衣', 中星微推出第二代人工智能芯片

集微网消息, 人工智能芯片在移动终端和机器视觉领域的落地, 快速地推动着AI变革的潮流, 也让端侧AI逐渐成为行业的焦点与热点. 而在这一波AI变革中, 中星微起到了不容忽视的推动作用.

早在2016年6月20日, 中星微就率先发布了中国首款嵌入式神经网络处理器 (NPU) 芯片——星光智能一号; 2018年5月18日, 中星微又在2018松山湖IC创新高峰论坛上, 推出了第二代人工智能芯片——星光智能二号. 据了解, 中星微星光智能一号在安防监控领域导入的芯片就有几万颗, 目前中星微整体芯片出货超过3亿美元.

从2016年中星微发布中国首款嵌入式NPU芯片后, 经过两年的发展, AI领域的投资和应用案例呈现井喷的态势. 那么, 目前人工智能芯片处于什么阶段? 未来AI芯片的终极形态又是怎样? 中星微智能有限公司首席技术官张亦农给出了答案, 并介绍了中星微第二代人工智能芯片——星光智能二号.

人工智能芯片处于什么阶段?

从产业发展的角度来看, 人工智能一般会经过从技术驱动, 到应用驱动, 再到商业驱动的发展过程. 目前人工智能的核心技术已经进入应用驱动阶段, 并在智能手机, 安防监控, 生态保护, 智能家居, 无人系统, 航天军工, 高铁运维等系统上开始规模化导入.

张亦农表示, 人工智能现在处于应用驱动阶段, 应用驱动的关键就是要给行业带来实质的产品. 当前人工智能领域投资, 应用案例呈现井喷的态势, 会快速推动人工智能向前发展, 而在应用驱动过后, 人工智能将进入商业驱动阶段, 届时AI会像互联网一样无所不在, 此时的AI就会演变为一场商业模式的较量.

在目前的应用驱动阶段, AI应用有前端和云端两种方式. 其中, 云端的应用主要包括新零售智能画像, 运营商智能网络管理等方式; 而在前端, AI在安防监控领域的应用是极佳的落地场景. 通过前端小智能云端大智能, 把前端和云端做到有机结合, 能够让在线推理的实时性, 数据的传输做的更好.

过去十多年, 安防监控经历了从模拟监控, 数字监控到网络监控. 现在发展到智能监控, 也是水到渠成的演进过程. 而从智能和监控的角度来看, 安防监控演进的核心在于监控标准的编码和理念, 并引入人工智能的元素. 过去编码标准里引入人工智能, 一定程度上码率很难往下降, 现在采用人工智能深度学习可以让码率继续下降.

另外, 从应用驱动的角度看, 人脸识别, 车辆识别的应用称出不穷, 如何把信息有效统一起来传到后台, 还要靠标准. 通过SVAC国家标准与专用信息通道有机结合, 这也是行业应用中真正的落地点.

ASIC芯片将会最终形态

近年来, 随着以比特币为代表的虚拟货币市场的持续火爆, 带动了一批 '挖矿' 厂商崛起, 其中最知名的要属比特大陆.

而比特大陆之所以能够在矿机市场异军突起, 则主要得益于其针对比特币矿机设计的ASIC芯片. 因为相对于CPU, GPU来说, 采用专用的ASIC芯片 '挖矿' 更具效率.

张亦农认为, 只要算法足够成熟, 且有足够的算力和功耗推动, 人工智能芯片也会很快走到ASIC.

从人工智能深度学习来看, 在区块链挖矿领域, 从2011到2013年芯片设计非常快的走完了从CPU→GPU→FPGA→ASIC的完整流程; 并且从2013到2018年, 在制程上, 从0.13微米到7nm制程, 中间相隔的10个工艺级别也快速走完, 这比一般的芯片设计公司两年迭代一次的速度要快很多. 所以, 张亦农强调, 只要有剧烈需求就会有快速转换, 未来ASIC肯定是人工智能芯片的主流.

在AI芯片的设计定位上, 目前业界对AI芯片是做主处理器还是做协处理器, 还存在不同的思考.

实际上, 做协处理是一定的好处, 协处理器的芯片设计相对单一, 不需要介入更多的行业应用, 但张亦农认为, AI应用对DDR和Memory带宽是不可或缺的, 如果只做协处理器, 对今后做大规模芯片的可行性和生态发展都有一定的局限, 所以中星微选择的是单芯片SoC集成的方案.

当然, 张亦农也强调, 人工智能芯片的设计, 要量体裁衣, 目前在应用驱动阶段, 芯片的算力不需要超过其他功能的性能指标; 而是要去追求性能和成本的平衡点, 追求利用单元率的灵活性和能耗比.

明年5月份发布第三代AI芯片

基于上述人工智能芯片的设计路径和所处的应用驱动阶段, 一个标准的人工智能应用是如何完成部署的呢?

张亦农透露, 一个标准的人工智能应用的部署可分三步走, 第一步是要在云端进行大规模训练. 训练包括标记, 浮点模型等, 这个模型会形成产生非常大的参数集; 第二步, 前端应用时要把模型参数降下来. 在这个过程中还涉及到再训练, 再训练所化的时间比第一步会少很多; 第三步将定点化缩小的模型下载到硬件进行仿真优化和前端推理.

在具体应用部署上, 以人工智能锁定犯罪嫌疑人为案例, 第一步进行信息采集编码; 第二步是对抽取的图像通过深度学习, 将人, 物的识别和轨迹识别做出来; 第三步对结构化的信息设置标签, 直接嵌入在标准中以ASIC的形式上传; 第四步接入公安平台, 后续破案直接进行结构化标签的搜索, 锁定嫌疑人.

而这套标准化的人工智能应用部署也正是中星微在人工智能领域的强项. 从目前的反馈来看, 中星微已经量产的星光智能一号在视频监控领域对识别, 分类, 跟踪都有独特优势. 相比传统方案存在误报, 漏报较高等问题, 中星微人工智能方案的精准度有大幅提升, 在实际刑侦中应用占有比率超过90%, 未来应用空间巨大.

相比星光智能一号, 此次中星微最新发布的第二代产品VC0718P ——星光智能二号则具备更高的性能, 支持国家标准SVAC2.0视音频编解码, 支持高达30fps@1080P视频实时编码, 内置高性能多核处理器, 可运行多种AI算法, 实现前端智能, 支持CABAC, 双向B帧, ROI, SVC, 监控专用信息, 加解密等SVAC特性, 支持BT.1120数据输出, 与外部AI协处理器无缝连接.

其中, 第二代NPU采用了分布式结构和并行计算的方式, 提供更为灵活的硬件方案; 运算能力可以满足1080P@30fps实时分类检测的需求, 是第一代NPU的16倍; 采用了独特的网络精简技术, 大幅降低了数据吞吐量, 进一步提升了芯片的能耗比和效率; 大幅增加了片上SRAM的容量, 减少了内存带宽上的压力, 整体效率比第一代有大幅度的提升.

从2014年定义人工智能芯片, 到2015年完成设计架构, 再到2016年正式发布星光智能一号, 以及此次发布的星光智能二号, 中星微在人工智能领域的路线布局并未止步, 据悉, 中星微第三代人工智能芯片也在规划中, 将在2019年5月份正式发布.

2016 GoodChinaBrand | ICP: 12011751 | China Exports