集微網消息, 諸多AI演算法公司在語音識別, 映像處理等領域大舉進攻, 迎來了資本的熱捧. 但如今風向已變, AI演算法公司在尋求應用落地的過程中, 發現演算法無法成為持續的 '抓手' , 開始尋求轉型之道. 這不, 最近國內數家語音創業公司已然陸續 '硬' 著陸, 推出了AI語音專用晶片, 包括思必馳, 出門問問, Rokid, 雲知聲等等. 拋開他們之間的 '明爭暗鬥' 及互懟不談, 以AI演算法單打獨鬥的時代顯然已然翻篇, 下一戰AI語音專用晶片的戰鬥已然打響.
演算法的末路
對於這些公司 '不約而同' 的選擇, 或許是時勢使然.
安創空間聯合創始人楊宇欣實話實說, 他在最近的第五期安創成長營路演會上表示, 創業公司純做演算法是難以長久的, 因為演算法是有瓶頸和天花板的, 可能根本就賣不了大錢, 所以一定要與硬體結合來實現商業價值.
商業價值是與場景應用密切相關的. '在某一細分場景, 商業價值在於能夠用性價比高和性能功耗比最好的硬體實現相應功能. 這些場景在量還沒有起來時大公司的晶片不可能切入, 因為大公司看重的是千萬級出貨量的市場. ' 楊宇欣認為, '在這一 '真空' 時段, 做演算法的公司技術上一定要做垂直整合, 即用晶片的方式保證自己的核心價值和利益. 因為自己有AI能力, 基於自己的演算法和能力可開發最適合自己的晶片, 實現最佳的匹配, 這是AI演算法公司商業價值最大化的必然趨勢. '
顯然這是一個 '進化' 中的結果, 演算法的世界必然是由算力作為基礎的, 演算法不足以支撐未來的成長, AI演算法公司的垂直整合成為必然的路徑選擇.
專用晶片成新戰場?
因而, AI語音演算法公司 '不約而同' 率先試水, 近期國內數家語音技術創業公司陸續推出AI語音專用晶片即為佐證. 上述這些AI語音領域的頭部創業公司, 幾乎都相繼押注AI語音專用晶片.
這一方面是演算法公司的 '騰籠換鳥' 之舉, 亦與市場的推力 '合拍' . 在語音應用中的一大市場智能音箱中, 迎來了銷量井噴期, Canalys預測, 2018年全球智能音箱出貨量將超過5600萬台. 此外, 車載市場, 智能家居等諸多場景中的硬體也開始語音化智能化, 將更加帶動AI專用語音晶片的爆發.
目前市場上智能音箱中的晶片方案或是由通用晶片兼顧語音處理, 或已有專用語音晶片接招. 例如天貓精靈使用的是聯發科MT8516語音晶片, 小米音箱使用的是晶晨A113晶片, 在這一形勢下, 國內一眾語音技術公司憑藉自身在語音識別, 自然語言處理, 語音交互設計等技術上的積累, 轉型做AI語音晶片整合及提供語音交互解決方案來得順理成章.
而隨著一眾AI語音公司加入戰團, 也將使市場格局和未來走勢難以明朗.
晶片的架構選擇?
從晶片架構來看, 不管是雲知聲發布的面向IoT領域的第一代UniOne晶片 '雨燕' , 還是出門問問推出的語音晶片模組問芯Mobvoi A1, 亦或是Rokid發布的SoC晶片KAMINO18, 都主打高整合度, 低功耗, 低成本, 可定製化等特點.
據悉, 雲知聲的 '雨燕' 晶片採用CPU+uDSP+DeepNet架構, 而出門問問和Rokid則宣布自己的晶片是基於杭州國芯科技晶片深度定製. Rokid曾確認KAMINO18基於40nm工藝的國芯GX8010製造.
國芯科技在去年底發布了兩款主打AI語音交互功能的NPU晶片GX8008和GX8010, 內置Cadence最新的Tensilica HIFI 4 DSP內核, 主打低功耗, 低成本, 可離線與整合化. 出門問問, Rokid等廠商通過整合麥克風陣列訊號處理, 降噪, 喚醒技術, 聲紋識別以及一些語音技能來成就自己的IC.
思必馳日前宣布完成D輪5億元融資, 由元禾控股, 中國民生投資集團領投, 深創投, 富士康, 聯發科跟投. 思必馳表示, 目前已與某晶片巨頭在AI晶片方面達成合作, 雙方將成立合資公司, 適用於智能語音交互的AI晶片已在研發過程中, 下半年將流片. 據悉, 這將是一款ASIC晶片, 同時具備聲學訊號處理能力和語音能力.
而晶片的比拼並不只是性價比那麼簡單, 提供整體的語音交互解決方案才是重 '芯' 所在. 其中, 雲知聲提出了雲端芯一體化的解決方案, 出門問問則要打造一站式軟硬結合的語音解決方案. 而思必馳宣稱要提供包括DUI平台, 語音晶片, 垂直方案等更全面的支援服務, 以及將走深化方案與平台能力, 提供智慧服務, 近期即將公布Business Assistant 企業智能服務業務.
市場的角力?
而這或只是語音專用晶片戰局的開始, 未來或有更多的演算法公司甚至巨頭 '攪入' , 這一戰局湧入如此多玩家, 亦註定是一場硬仗.
而AI專用語音晶片能否持續爆發, 一方面要看這些晶片能否大規模應用, 另一方面還要看這些產品的語音交互能力到底能否得到市場的青睞.
清華大學微電子所所長魏少軍在接受媒體採訪時曾表示, AI的殺手級應用還沒出現, 不管是智能音箱還是其他產品, 都還沒有成為一個剛需. 因此, 只有使語音真正成為人機交互的主流, 才能推動AI語音晶片的爆發.
而除一體化的解決方案之外, 與場景的深度融合才是未來真正的考驗. 楊宇欣表示, AI公司如果只做晶片, 沒有演算法和場景的話立馬就會遇到生態系統的問題, 必須要有場景, 有演算法, 有晶片. 現在有了演算法和晶片, 關鍵的問題是如何深入場景打造優秀的語音交互體驗?
思必馳, 雲知聲, 出門問問, Rokid等在應用場景的布局有諸多交叉, 均集中智能家居, 車載, 機器人等領域, 這應是未來的主戰場. 當然, 他們也都在積極探索新的業務場景, 如醫療, 智慧服務等. 未來的戰線也將拖得越來越長.