语音算法公司争夺的下一战 | 为何是芯片?

诸多AI算法公司在语音识别, 图像处理等领域大举进攻, 迎来了资本的热捧. 但如今风向已变, AI算法公司在寻求应用落地的过程中, 发现算法无法成为持续的 '抓手' , 开始寻求转型之道. 这不, 最近国内数家语音创业公司已然陆续 '硬' 着陆, 推出了AI语音专用芯片, 包括思必驰, 出门问问, Rokid, 云知声等等. 抛开他们之间的 '明争暗斗' 及互怼不谈, 以AI算法单打独斗的时代显然已然翻篇, 下一战AI语音专用芯片的战斗已然打响.

算法的末路

对于这些公司 '不约而同' 的选择, 或许是时势使然.

安创空间联合创始人杨宇欣实话实说, 他在最近的第五期安创成长营路演会上表示, 创业公司纯做算法是难以长久的, 因为算法是有瓶颈和天花板的, 可能根本就卖不了大钱, 所以一定要与硬件结合来实现商业价值.

商业价值是与场景应用密切相关的. '在某一细分场景, 商业价值在于能够用性价比高和性能功耗比最好的硬件实现相应功能. 这些场景在量还没有起来时大公司的芯片不可能切入, 因为大公司看重的是千万级出货量的市场. ' 杨宇欣认为, '在这一 '真空' 时段, 做算法的公司技术上一定要做垂直整合, 即用芯片的方式保证自己的核心价值和利益. 因为自己有AI能力, 基于自己的算法和能力可开发最适合自己的芯片, 实现最佳的匹配, 这是AI算法公司商业价值最大化的必然趋势. '

显然这是一个 '进化' 中的结果, 算法的世界必然是由算力作为基础的, 算法不足以支撑未来的成长, AI算法公司的垂直整合成为必然的路径选择.

专用芯片成新战场?

因而, AI语音算法公司 '不约而同' 率先试水, 近期国内数家语音技术创业公司陆续推出AI语音专用芯片即为佐证. 上述这些AI语音领域的头部创业公司, 几乎都相继押注AI语音专用芯片.

这一方面是算法公司的 '腾笼换鸟' 之举, 亦与市场的推力 '合拍' . 在语音应用中的一大市场智能音箱中, 迎来了销量井喷期, Canalys预测, 2018年全球智能音箱出货量将超过5600万台. 此外, 车载市场, 智能家居等诸多场景中的硬件也开始语音化智能化, 将更加带动AI专用语音芯片的爆发.

目前市场上智能音箱中的芯片方案或是由通用芯片兼顾语音处理, 或已有专用语音芯片接招. 例如天猫精灵使用的是联发科MT8516语音芯片, 小米音箱使用的是晶晨A113芯片, 在这一形势下, 国内一众语音技术公司凭借自身在语音识别, 自然语言处理, 语音交互设计等技术上的积累, 转型做AI语音芯片集成及提供语音交互解决方案来得顺理成章.

而随着一众AI语音公司加入战团, 也将使市场格局和未来走势难以明朗.

芯片的架构选择?

从芯片架构来看, 不管是云知声发布的面向IoT领域的第一代UniOne芯片 '雨燕' , 还是出门问问推出的语音芯片模组问芯Mobvoi A1, 亦或是Rokid发布的SoC芯片KAMINO18, 都主打高集成度, 低功耗, 低成本, 可定制化等特点.

据悉, 云知声的 '雨燕' 芯片采用CPU+uDSP+DeepNet架构, 而出门问问和Rokid则宣布自己的芯片是基于杭州国芯科技芯片深度定制. Rokid曾确认KAMINO18基于40nm工艺的国芯GX8010制造.

国芯科技在去年底发布了两款主打AI语音交互功能的NPU芯片GX8008和GX8010, 内置Cadence最新的Tensilica HIFI 4 DSP内核, 主打低功耗, 低成本, 可离线与集成化. 出门问问, Rokid等厂商通过集成麦克风阵列信号处理, 降噪, 唤醒技术, 声纹识别以及一些语音技能来成就自己的IC.

思必驰日前宣布完成D轮5亿元融资, 由元禾控股, 中国民生投资集团领投, 深创投, 富士康, 联发科跟投. 思必驰表示, 目前已与某芯片巨头在AI芯片方面达成合作, 双方将成立合资公司, 适用于智能语音交互的AI芯片已在研发过程中, 下半年将流片. 据悉, 这将是一款ASIC芯片, 同时具备声学信号处理能力和语音能力.

而芯片的比拼并不只是性价比那么简单, 提供整体的语音交互解决方案才是重 '芯' 所在. 其中, 云知声提出了云端芯一体化的解决方案, 出门问问则要打造一站式软硬结合的语音解决方案. 而思必驰宣称要提供包括DUI平台, 语音芯片, 垂直方案等更全面的支持服务, 以及将走深化方案与平台能力, 提供智慧服务, 近期即将公布Business Assistant 企业智能服务业务.

市场的角力?

而这或只是语音专用芯片战局的开始, 未来或有更多的算法公司甚至巨头 '搅入' , 这一战局涌入如此多玩家, 亦注定是一场硬仗.

而AI专用语音芯片能否持续爆发, 一方面要看这些芯片能否大规模应用, 另一方面还要看这些产品的语音交互能力到底能否得到市场的青睐.

清华大学微电子所所长魏少军在接受媒体采访时曾表示, AI的杀手级应用还没出现, 不管是智能音箱还是其他产品, 都还没有成为一个刚需. 因此, 只有使语音真正成为人机交互的主流, 才能推动AI语音芯片的爆发.

而除一体化的解决方案之外, 与场景的深度融合才是未来真正的考验. 杨宇欣表示, AI公司如果只做芯片, 没有算法和场景的话立马就会遇到生态系统的问题, 必须要有场景, 有算法, 有芯片. 现在有了算法和芯片, 关键的问题是如何深入场景打造优秀的语音交互体验?

思必驰, 云知声, 出门问问, Rokid等在应用场景的布局有诸多交叉, 均集中智能家居, 车载, 机器人等领域, 这应是未来的主战场. 当然, 他们也都在积极探索新的业务场景, 如医疗, 智慧服务等. 未来的战线也将拖得越来越长.

2016 GoodChinaBrand | ICP: 12011751 | China Exports