集微網消息 (文/九畹芳) , 亞馬遜Echo, 阿里天貓精靈等AI智能音箱的爆發, 倒逼上遊語音晶片迎來了新格局. 5至7月, 國內有超過5家語音技術創業公司對外發布AI語音晶片.
5月16日, 雲知聲發布首款面向物聯網領域的AI系列晶片UniOne以及第一代晶片 '雨燕' ; 5月24日, 出門問問發布旗下首款AI語音晶片模組問芯Mobvoi A1; 7月2日, Rokid發布旗下AI語音專用SoC晶片KAMINO18; 而在同一時間, 思必馳CEO高始興確認公司正在打造AI語音ASIC晶片, 預計今年下半年流片. 語音晶片 '三步曲' AI語音未來已來? 語音晶片的發展經曆了三個階段, 通用晶片, 專用晶片和AI晶片. 在智能語音設備早期階段 (2014-2015年) , 由於晶片研發周期漫長 (18-24個月) , 研發投入高昂, 在終端銷量難以支撐晶片規模爆發的情況下, 市場均採用通用晶片.
通用晶片, 指AP晶片/平板晶片等+Codec晶片/DSP晶片等組合的方式, 由Codec晶片進行數模訊號的轉換, DSP對數字訊號進行處理, 包括回聲消除, 雜訊抑制, 語音降噪/增強等, 最後加入雲端的計算支援. 代表晶片是聯發科MT8563和全志R16 (平板晶片) .
專用晶片, 是語音晶片發展的第二個階段, 其採用適合做語音處理的CPU, 加上多通道麥克風陣列介面, 在語音演算法上支援回聲消除, 雜訊抑制, 聲源定位, 語音增強等技術, 併兼具運算能力和低功耗的考量. 代表晶片有聯發科MT8516, 科勝訊CX20924, 晶晨半導體A113, 瑞芯微RK3036和北京君正X1000. 這類晶片未內置神經網路加速器, AI多藉助雲端實現.
有分析人士指出, 專用晶片的特點是, 語音識別, 語義理解, 語音合成, 任務執行等都是在雲端進行, 但云端存在著語音交互 '時延' 的問題, 對網路的需求限制了設備的使用空間, 並帶來了數據與隱私危機.
而作為第三代語音技術的AI語音晶片正好解決了這些問題: (1) 整合了專用AI處理器模組 (NPU) , 用以對本地的機器學習演算法進行加速; (2) 語音AI晶片不但整合CPU, NPU, 還整合DSP訊號處理, Wi-Fi/藍芽等模組; (3) 能夠實現 '端側' 智能, 將常用功能由雲端轉換到本地, 可離線操作並解決用戶數據隱私問題. 成都啟英泰倫在2016年推出的CI1006, 杭州國芯在2017年10月底推出的GX8010, 是典型的AI語音晶片代表.
以上是語音晶片發展的 '三步曲' , 從目前終端市場對上述三類晶片的採用比例來看, 專用語音晶片獨佔鰲頭, 有數據顯示, 在2017年3000萬台智能音箱的銷量中70%被MTK囊括. 分析人士認為, 專用晶片佔據主導的原因有二, 一是通用晶片已經過時, 多是借用平板/OTT的AP晶片, 只是簡單的將多媒體數字編碼器與DSP相結合, 其在語音上發揮的功效並不大; 二是初出茅廬的AI晶片才剛起步, 生態尚在建立當中.
Rokid副總裁及基礎平台負責人周軍表示: '目前, 通用晶片已難滿足智能音箱的場景需求, 我們早期的產品也採用的是通用晶片, 其最大的挑戰在於即時喚醒功能, 需要兩個核長時間同時工作, 功耗高且不便攜, 有時需要四核甚至八核的運算速度. '
目前, 聯發科, 科勝訊, 晶晨, 瑞芯微, 君正, 炬芯等廠商是專用語音晶片出貨的主力, 那麼, 隨著國芯, Rodik, 出門問問, 雲知聲等更多AI語音公司出現, AI語音晶片會最終取代專用語音晶片, 主導終端應用市場嗎?
杭州國芯人工智慧事業部總經理淩雲對 集微網記者表示, 目前難以下定論AI語音晶片是否會全面替代專用語音晶片, AI晶片的最終目的是要應用, 是要讓產品落地, 各家有自己不同的路線和做法, 找到合適自己的應用場景就行.
中天微智能語音平台負責人勞懋元也告訴記者: '當前處於AI晶片早期, 很多企業都在構建自己的技術路線, 基於之前的積累做AI解決方案, 暫時難以判斷誰會最終勝出. 更為關鍵的是, 目前還不是廝殺的時候, 需要產業界合力共同打造這個市場. '
有不願透露姓名的受訪人士表示, 隨著智能語音終端量的爆發, 雲知聲, 出門問問, Rokid, 思必馳等語音技術處理公司, 通過跟國芯等晶片公司 '定製' 的方式, 加入到AI語音晶片/模組開發的陣列中來, 雖然時間上落後於MTK, AMLogic, 君正, 炬芯等, 但是藉助AI晶片本身的優勢, 註定將得到更多市場的擁戴.
據集微網記者了解, 國芯研發的AI晶片提供數字訊號處理器DSP, 神經網路處理器NPU以及USB/IIS/IIC/UART等標準介面. 出門問問, Rokid等廠商不需要做IP設計, 只需要進行架構整合, 這些整合大多是麥克風陣列訊號處理, 降噪, 喚醒技術, 聲紋識別以及一些語音技能. 雲知聲雖是自研設計的uDSP和DeepNet架構, 但在功能上與以上兩款晶片基本相當. 總之, 三類語音晶片仍各有市場, 最終表現還有待觀察.
場景定製晶片 千萬級應用方能收回成本
目前, 特殊場景對AI晶片的需求各有不同. '在AI場景應用中, 只有深度晶片定製, 才能更好的實現AI的功能' 已成為業界的共識. 然而, 定製晶片的成本高昂, 是擺在諸多廠商面前的一道坎.
有業界人士指出, AI晶片一方面要有足夠的算力去運行各種語音演算法, 另一方面還要針對各種場景做大量介面的適配, 同時讓成本和功耗滿足大規模量產的商業要求. 這本身就是一個很大的挑戰.
'如果是企業自行研發AI晶片, 採用40nm工藝, 那麼成本可能會上漲而不是降低. 晶片必須靠規模分攤研發成本, 40nm工藝僅流片費就高達1000萬元, 分攤給100萬PCS (某一產品單位數量) , 平均每片成本高達10元, 這還不包括更加高額的研發費用. ' 有行業人士表示.
炬芯科技在接受集微網記者採訪時也表達了同樣的觀點, 晶片的毛利本身就很低, 以一顆55nm的晶片為例, 大概需要投入幾百萬美金, 研發費用還要除外. 他表示, 只有那些能拿到融資的有實力的公司才有能力去做晶片定製.
對此, Rokid平台研發負責人朱斌並不認同: '智能設備採用通用晶片是殺雞用牛刀, 特殊需求需要特殊晶片來解決痛點, 定製AI晶片恰恰是在降低成本, 人工智慧硬體對算力有需求, 低端的通用晶片算力不夠, 高端的通用晶片又有許多冗餘設計, 造成高功耗. '
與朱斌的觀點相同, 雲知聲IoT事業部副總裁康恒同樣認為, 定製晶片是為了省成本而不是提高成本, '電視, 空調等大家電產品的利潤足以覆蓋語音模組的高成本, 但風扇, 電燈等小家電成本限制較大, 模組的優勢便削弱了, 客戶想做更多的智能品類, 下沉到低端產品, 但市場上根本找不到合適的晶片, 一款百元以內的產品, 通用晶片並不划算. 打造自己的AI晶片後, 雲知聲可以把語音AI技術的晶片方案開放給客戶, 在成本及供應周期上有了更大的主動權. '
上述兩個截然不同的觀點, 出自晶片公司跟演算法公司完全不同的出發點. 據記者了解, 儘管定製AI晶片是天價投入, 但為了實現智能終端更接近AI功能, 仍有不少廠商開始做定製晶片.
2016年, Rokid聯合杭州國芯開發的KAMINO18就是定製晶片的代表, 思必馳的定製晶片下半年即將流片. 無獨有偶, 據今年3月外媒Information的報道, 亞馬遜也正在設計定製用於支援智能音箱Echo的AI晶片, 當時消息稱亞馬遜已經擁有449名有晶片專業知識和技能的員工.
定製晶片有一個原則, 就是要有足夠的量來支撐成本的回收. 至於Rokid, 思必馳, 亞馬遜在晶片定製化過程中投入了多少成本, 這個成本需要依靠賣出多少終端才能收回, 目前記者沒有獲取詳細的資訊. 不過, 杭州國芯淩雲表示, 一顆晶片要達到收支平衡, 至少使用這顆晶片的終端要達到千萬級的量, 如果是定製的話, 至少是百萬級.
Rokid聯合創始人王舜德也曾表示, 定製晶片最重要的一個點就是量, 晶片關鍵的利潤點, 量要達五百萬顆以上.
'這也是國芯的AI晶片跟穀歌, 英偉達AI晶片的區別, ' 淩雲表示, 穀歌, 英偉達更多是在做雲端的晶片, 雲端晶片對成本和功耗不敏感, 且單顆晶片的規模就能做很大, 但端側不同, 端側必須要從應用場景出發, 根據實際場景去做定製, 一旦這個場景的銷量難以支撐起晶片定製的成本, 就會虧本.
那麼, 短期內有何行之有效的解決方法呢? 淩雲強調說: '從零開始定製一顆晶片並不理智, 成本周期太長, 建議晶片公司定義晶片開發時, 儘可能去覆蓋更多的應用場景, 同時建議下遊廠商經常跟上遊晶片公司溝通, 讓晶片商儘可能在前端設計時就將客戶需求考慮進去, 如此就無須支付額外的成本. '
目前, 據了解, 基於Rokid, 雲知聲AI晶片以及出門問問AI模組的產品已經開始鋪向市場了, 有企業已經獲得百萬級訂單, 這是一個好兆頭. Rokid周軍告訴集微網記者: '目前Rokid晶片與方案已經成熟了, 得到了諸如互聯網公司, 兒童教育市場的採用, 我們有信心定製更好的晶片來支撐客戶更好的發展. '
作為國內做 '核' 的廠商, 中天微智能語音平台負責人勞懋元堅定地表示: '百箱大戰讓AI語音交互成為炙手可熱的焦點, 但智能音箱只是冰山一角, 萬物互聯才是最終的目標! 一顆晶片不可能覆蓋所有的市場, 如AI音箱晶片就不可以做進車載. 我們會堅持自己的路線, 做專用AI語音晶片和定製化解決方案. '
總而言之, AI晶片定製成本是一個大的問題, 但諸多受訪者仍一致認為, 場景定製AI晶片的價值會更大, 是大勢所趨. 至於如何解決成本問題, 還得看Rokid, 雲知聲, 思必馳為代表的AI晶片定製公司, 能否在預定時間內達到收支平衡, 從而給行業樹立信心.