集微网消息 (文/九畹芳) , 亚马逊Echo, 阿里天猫精灵等AI智能音箱的爆发, 倒逼上游语音芯片迎来了新格局. 5至7月, 国内有超过5家语音技术创业公司对外发布AI语音芯片.
5月16日, 云知声发布首款面向物联网领域的AI系列芯片UniOne以及第一代芯片 '雨燕' ; 5月24日, 出门问问发布旗下首款AI语音芯片模组问芯Mobvoi A1; 7月2日, Rokid发布旗下AI语音专用SoC芯片KAMINO18; 而在同一时间, 思必驰CEO高始兴确认公司正在打造AI语音ASIC芯片, 预计今年下半年流片. 语音芯片 '三步曲' AI语音未来已来? 语音芯片的发展经历了三个阶段, 通用芯片, 专用芯片和AI芯片. 在智能语音设备早期阶段 (2014-2015年) , 由于芯片研发周期漫长 (18-24个月) , 研发投入高昂, 在终端销量难以支撑芯片规模爆发的情况下, 市场均采用通用芯片.
通用芯片, 指AP芯片/平板芯片等+Codec芯片/DSP芯片等组合的方式, 由Codec芯片进行数模信号的转换, DSP对数字信号进行处理, 包括回声消除, 噪声抑制, 语音降噪/增强等, 最后加入云端的计算支持. 代表芯片是联发科MT8563和全志R16 (平板芯片) .
专用芯片, 是语音芯片发展的第二个阶段, 其采用适合做语音处理的CPU, 加上多通道麦克风阵列接口, 在语音算法上支持回声消除, 噪声抑制, 声源定位, 语音增强等技术, 并兼具运算能力和低功耗的考量. 代表芯片有联发科MT8516, 科胜讯CX20924, 晶晨半导体A113, 瑞芯微RK3036和北京君正X1000. 这类芯片未内置神经网络加速器, AI多借助云端实现.
有分析人士指出, 专用芯片的特点是, 语音识别, 语义理解, 语音合成, 任务执行等都是在云端进行, 但云端存在着语音交互 '时延' 的问题, 对网络的需求限制了设备的使用空间, 并带来了数据与隐私危机.
而作为第三代语音技术的AI语音芯片正好解决了这些问题: (1) 集成了专用AI处理器模块 (NPU) , 用以对本地的机器学习算法进行加速; (2) 语音AI芯片不但集成CPU, NPU, 还集成DSP信号处理, Wi-Fi/蓝牙等模块; (3) 能够实现 '端侧' 智能, 将常用功能由云端转换到本地, 可离线操作并解决用户数据隐私问题. 成都启英泰伦在2016年推出的CI1006, 杭州国芯在2017年10月底推出的GX8010, 是典型的AI语音芯片代表.
以上是语音芯片发展的 '三步曲' , 从目前终端市场对上述三类芯片的采用比例来看, 专用语音芯片独占鳌头, 有数据显示, 在2017年3000万台智能音箱的销量中70%被MTK囊括. 分析人士认为, 专用芯片占据主导的原因有二, 一是通用芯片已经过时, 多是借用平板/OTT的AP芯片, 只是简单的将多媒体数字编码器与DSP相结合, 其在语音上发挥的功效并不大; 二是初出茅庐的AI芯片才刚起步, 生态尚在建立当中.
Rokid副总裁及基础平台负责人周军表示: '目前, 通用芯片已难满足智能音箱的场景需求, 我们早期的产品也采用的是通用芯片, 其最大的挑战在于实时唤醒功能, 需要两个核长时间同时工作, 功耗高且不便携, 有时需要四核甚至八核的运算速度. '
目前, 联发科, 科胜讯, 晶晨, 瑞芯微, 君正, 炬芯等厂商是专用语音芯片出货的主力, 那么, 随着国芯, Rodik, 出门问问, 云知声等更多AI语音公司出现, AI语音芯片会最终取代专用语音芯片, 主导终端应用市场吗?
杭州国芯人工智能事业部总经理凌云对 集微网记者表示, 目前难以下定论AI语音芯片是否会全面替代专用语音芯片, AI芯片的最终目的是要应用, 是要让产品落地, 各家有自己不同的路线和做法, 找到合适自己的应用场景就行.
中天微智能语音平台负责人劳懋元也告诉记者: '当前处于AI芯片早期, 很多企业都在构建自己的技术路线, 基于之前的积累做AI解决方案, 暂时难以判断谁会最终胜出. 更为关键的是, 目前还不是厮杀的时候, 需要产业界合力共同打造这个市场. '
有不愿透露姓名的受访人士表示, 随着智能语音终端量的爆发, 云知声, 出门问问, Rokid, 思必驰等语音技术处理公司, 通过跟国芯等芯片公司 '定制' 的方式, 加入到AI语音芯片/模组开发的阵列中来, 虽然时间上落后于MTK, AMLogic, 君正, 炬芯等, 但是借助AI芯片本身的优势, 注定将得到更多市场的拥戴.
据集微网记者了解, 国芯研发的AI芯片提供数字信号处理器DSP, 神经网络处理器NPU以及USB/IIS/IIC/UART等标准接口. 出门问问, Rokid等厂商不需要做IP设计, 只需要进行架构集成, 这些集成大多是麦克风阵列信号处理, 降噪, 唤醒技术, 声纹识别以及一些语音技能. 云知声虽是自研设计的uDSP和DeepNet架构, 但在功能上与以上两款芯片基本相当. 总之, 三类语音芯片仍各有市场, 最终表现还有待观察.
场景定制芯片 千万级应用方能收回成本
目前, 特殊场景对AI芯片的需求各有不同. '在AI场景应用中, 只有深度芯片定制, 才能更好的实现AI的功能' 已成为业界的共识. 然而, 定制芯片的成本高昂, 是摆在诸多厂商面前的一道坎.
有业界人士指出, AI芯片一方面要有足够的算力去运行各种语音算法, 另一方面还要针对各种场景做大量接口的适配, 同时让成本和功耗满足大规模量产的商业要求. 这本身就是一个很大的挑战.
'如果是企业自行研发AI芯片, 采用40nm工艺, 那么成本可能会上涨而不是降低. 芯片必须靠规模分摊研发成本, 40nm工艺仅流片费就高达1000万元, 分摊给100万PCS (某一产品单位数量) , 平均每片成本高达10元, 这还不包括更加高额的研发费用. ' 有行业人士表示.
炬芯科技在接受集微网记者采访时也表达了同样的观点, 芯片的毛利本身就很低, 以一颗55nm的芯片为例, 大概需要投入几百万美金, 研发费用还要除外. 他表示, 只有那些能拿到融资的有实力的公司才有能力去做芯片定制.
对此, Rokid平台研发负责人朱斌并不认同: '智能设备采用通用芯片是杀鸡用牛刀, 特殊需求需要特殊芯片来解决痛点, 定制AI芯片恰恰是在降低成本, 人工智能硬件对算力有需求, 低端的通用芯片算力不够, 高端的通用芯片又有许多冗余设计, 造成高功耗. '
与朱斌的观点相同, 云知声IoT事业部副总裁康恒同样认为, 定制芯片是为了省成本而不是提高成本, '电视, 空调等大家电产品的利润足以覆盖语音模组的高成本, 但风扇, 电灯等小家电成本限制较大, 模组的优势便削弱了, 客户想做更多的智能品类, 下沉到低端产品, 但市场上根本找不到合适的芯片, 一款百元以内的产品, 通用芯片并不划算. 打造自己的AI芯片后, 云知声可以把语音AI技术的芯片方案开放给客户, 在成本及供应周期上有了更大的主动权. '
上述两个截然不同的观点, 出自芯片公司跟算法公司完全不同的出发点. 据记者了解, 尽管定制AI芯片是天价投入, 但为了实现智能终端更接近AI功能, 仍有不少厂商开始做定制芯片.
2016年, Rokid联合杭州国芯开发的KAMINO18就是定制芯片的代表, 思必驰的定制芯片下半年即将流片. 无独有偶, 据今年3月外媒Information的报道, 亚马逊也正在设计定制用于支持智能音箱Echo的AI芯片, 当时消息称亚马逊已经拥有449名有芯片专业知识和技能的员工.
定制芯片有一个原则, 就是要有足够的量来支撑成本的回收. 至于Rokid, 思必驰, 亚马逊在芯片定制化过程中投入了多少成本, 这个成本需要依靠卖出多少终端才能收回, 目前记者没有获取详细的信息. 不过, 杭州国芯凌云表示, 一颗芯片要达到收支平衡, 至少使用这颗芯片的终端要达到千万级的量, 如果是定制的话, 至少是百万级.
Rokid联合创始人王舜德也曾表示, 定制芯片最重要的一个点就是量, 芯片关键的利润点, 量要达五百万颗以上.
'这也是国芯的AI芯片跟谷歌, 英伟达AI芯片的区别, ' 凌云表示, 谷歌, 英伟达更多是在做云端的芯片, 云端芯片对成本和功耗不敏感, 且单颗芯片的规模就能做很大, 但端侧不同, 端侧必须要从应用场景出发, 根据实际场景去做定制, 一旦这个场景的销量难以支撑起芯片定制的成本, 就会亏本.
那么, 短期内有何行之有效的解决方法呢? 凌云强调说: '从零开始定制一颗芯片并不理智, 成本周期太长, 建议芯片公司定义芯片开发时, 尽可能去覆盖更多的应用场景, 同时建议下游厂商经常跟上游芯片公司沟通, 让芯片商尽可能在前端设计时就将客户需求考虑进去, 如此就无须支付额外的成本. '
目前, 据了解, 基于Rokid, 云知声AI芯片以及出门问问AI模组的产品已经开始铺向市场了, 有企业已经获得百万级订单, 这是一个好兆头. Rokid周军告诉集微网记者: '目前Rokid芯片与方案已经成熟了, 得到了诸如互联网公司, 儿童教育市场的采用, 我们有信心定制更好的芯片来支撑客户更好的发展. '
作为国内做 '核' 的厂商, 中天微智能语音平台负责人劳懋元坚定地表示: '百箱大战让AI语音交互成为炙手可热的焦点, 但智能音箱只是冰山一角, 万物互联才是最终的目标! 一颗芯片不可能覆盖所有的市场, 如AI音箱芯片就不可以做进车载. 我们会坚持自己的路线, 做专用AI语音芯片和定制化解决方案. '
总而言之, AI芯片定制成本是一个大的问题, 但诸多受访者仍一致认为, 场景定制AI芯片的价值会更大, 是大势所趋. 至于如何解决成本问题, 还得看Rokid, 云知声, 思必驰为代表的AI芯片定制公司, 能否在预定时间内达到收支平衡, 从而给行业树立信心.