對話Rokid等多個明星背後的晶片公司杭州國芯

昨天, 可能是國內最有明星公司範兒的 Rokid 召開了成立 4 年後的首場發布會 Rokid Jungle, 而這個發布會從各方面的評價來看, 可以評選為迄今為止國內最潮的也是體驗最有範兒的一次 AI 創業公司的發布會. Misa 帶著他的團隊, 發布了在此之前已經前戲已久的 Rokid 首款自研 AI 晶片——KAMINO18.

從 Rokid 的這款自研 AI 晶片說起在昨晚深圳灣的報道中, 我們對 KAMINO18 做出了這樣中立的描述:

一塊 AI 語音專用的 SoC 晶片, 整合了 ARM, NPU, DSP, DDR, DAC 等多個核心元件, 而大小僅與一元硬幣相當. 結合 Rokid 相控陣技術, CTC模型, 自定義喚醒詞, 離線語音指令, 低功耗喚醒等演算法, 在整機工作狀態下, 搭載 KAMINO18 的產品功耗可降低 30%-50%. 在聲音嘈雜的場景下也有更好的表現, 同時能夠支援更多的離線功能. 而在成本上, KAMINO18 的整體成本相較市場主流通用晶片方案可以壓低 30% 以上.

喜馬拉雅 FM 也宣布正式與Rokid 確定戰略合作關係, 喜馬拉雅的兒童智能音箱曉雅 Mini 即將成為使用 Rokid KAMINO18 的外部產品. 同時, 喜馬拉雅 FM 在能容方面的能力也將被整合到 KAMINO18 中.

此外, Rokid CEO Misa 還宣布 KAMINO18 即將支援 Amazon Alexa, 基於語言識別技術, 可以實現在若琪和 Alexa 之間無縫切換, 識別到用戶說中文時調用若琪, 說英文時則調用 Alexa.

在會後的採訪中, Misa 表示, Rokid 並不是「賣晶片」, 晶片只是 Rokid 對外輸出技術解決方案時「有競爭力的元素」, Rokid 在 AI 領域的產品經驗和能力還是會通過技術方案的方式賦能給合作夥伴. 此外, Misa 還進一步透露, KAMINO18 目前已經拿下數百萬片的預定.

△ Rokid 首款自研晶片 KAMINO18

儘管本著新聞原創的精神, 在報道中我們連圖片都儘可能用現場拍的, 這個用硬幣對比的晶片, 還是在現場巨大的環形屏幕的襯托下, 顯得體積格外的大, 看上去就像一塊整合了 AI 能力的開發板.

而這張在發布會之前我實際獲得的諜報圖片, 可能會讓這個晶片看上去更加「Small is Beautiful」, 如 Misa 在發布會上所述:

△ Rokid 首款自研晶片 KAMINO18

半路殺出個程咬金

6 月 26 日是 Rokid 早就定好的發布會日期, 而在此之前可謂是「半路殺出個程咬金」, 雲知聲和出門問問分別早於 Rokid 開了發布會.

在 5 月26 日召開的出門問問戰略新品發布會上, 李志飛做了一次創業 6 年來的商業戰略解讀, 同時推出了「中國首個已量產的 AI 語音晶片模組」. 可能是因為這個模組的名字叫「問芯」吧, 出門問問在發布會及之後的行業通稿裡, 都在強調這是「模組」, 卻被一眾不清楚事實的媒體解讀為「中國首款 AI 語音晶片」.

是不是首款, 是不是晶片, 對於這些解讀, 沒有人出來開撕, 出門問問官方自然就沒有必要過問了. 重要的是, 李志飛也期待「為中國芯作出貢獻」.

△ 在 6 月上海召開的 CES Asia 展會上, 出門問問展出的晶片模組

據李志飛介紹, 「問芯」基於去年出門問問推出的智能語音交互 SDK 而打造, 整合了出門問問的麥克風陣列訊號處理技術, 語音交互 SDK 與可定製語義技能.

是時候介紹 Rokid, 出門問問這些明星背後的晶片公司了

杭州國芯科技是 Rokid 和出門問問的晶片合作方, 我對這家公司的了解, 開始於去年 10 月他們在深圳召開的一次發布會. 當時, 這家杭州「國」字頭從機頂盒方案起家的老牌晶片企業, 僅花了 10 萬元組織了一場活動, 邀請到了 Misa 等一票合作夥伴為之月台, 並宣布推出適合音箱, 電視, 兒童故事機, 車載等 AI 產品的 GX8010 物聯網人工智慧晶片.

簡單綜述一下這款晶片的特性 (詳情可以參閱深圳灣報道——功耗問題讓智能音箱離不開固定電源, 而這家國產 AI 晶片商的方案值得看) :

△ 杭州國芯的 GX8010 晶片

本地離線神經網路計算: 內置了國芯自主研發的 gxNPU 神經網路處理器, 壓縮計算權重, 使得計算時需要的記憶體和頻寬更少, 從而實現離線計算.

高整合: 整合了 Cadence Tensilica 最高階的語音 DSP Hifi-4, 該專為智能語音設計的 DSP 可高效地進行各種語音訊號處理計算. 同時在這顆 DSP 上, 整合思必馳, Rokid 等語音演算法公司的 AI 演算法能力.

低成本: 因為高度整合, 使得產品所需的外圍器件減少, 從而降低了 BOM 成本.

低功耗: 在動態功耗上, 利用多核異構的優勢, 合理安排每個模組的工作頻率和啟停時機; 待機方面, 採用了多級喚醒機制.

誰在 AI 晶片的風口浪尖?

對於 WHO 的問題, 拋開如上那些「弄潮兒」製造的新聞熱點, 杭州國芯人工智慧事業部總經理淩雲在與深圳灣的對話開篇, 就直截了當的給出了歸納性的回答:

最想做晶片的, 是這些 AI 演算法公司. 在他們賦能和改造非智能產品的過程中, 他們需要更好的適應演算法的硬體載體, 一方面便於調優演算法, 提高效率; 另一方面則是出於更優的商業模式的考慮.

我以我文科生的腦袋, 對這一觀點進行了解讀, 詳細闡釋如下 (這樣, 那些最初和我一樣不懂晶片的人, 或許就能看懂了) :

AI 改造 IoT, 但 IoT 產品的使用場景和設備形態是各異的, 而這些設備又用的不同的晶片的, 這就難免這些 AI 公司和各種晶片公司打交道. 同時, 這些 AI 公司的演算法能力在落地到硬體終端 (如麥克風設備) 過程中, 還要在硬體端進行反覆進行演算法調優, 其中要打交道的人和物就更多了. 不可控性, 成本高, 效率低, 都催生了 AI 公司想要自己做專用晶片的想法.

AI 公司要將自己的演算法能力賦能到 IoT 的各行各業, 其產品輸出是以軟體 SDK 的形式展開的, 而軟體因為可以被核算為「零成本」而比較難的在客戶那裡報出價來, 因此 AI 公司就考慮通過「硬體化」來輸出自己的能力. 產品升級路線一般為: 軟體 SDK, 硬體模組, 晶片.

而以晶片為載體整合自己的雲端服務能力, AI 演算法能力, 以及從 AI 公司的角度所理解的硬體端的演算法能力, 這樣做的好處是: 成本透明, 可控, 運行效率高, 未來大規模量產後的利潤可觀, 以及可以更好的向董事會做前景規劃.

這方面, 相比 BAT 等巨頭, AI 創業公司更加靈活, 因而也跑的更快.

成為能夠整合演算法的晶片公司後, 傳統晶片公司怎麼看?

「有量嗎? 」

這種頗有一番「呵呵」意味的不恭態度, 倒是接近問題的本質.

晶片的生意就是一門「低價走量」的生意. 設備上量, 成本降低, 利潤增長. 而這個增長曲線, 也就成為了所有晶片公司進行前期產品選型, 以及後期產品銷售的策略參考.

在深圳灣和杭州國芯的對話中, 淩雲描述了「自研晶片」誕生的過程. 國芯和 Rokid 合作的定製晶片, 開始於去年秋季, 研發期已經有大半年了, 雙方投入了不小的人力. 而國芯和出門問問的合作, 則開始於今年, 主要合作研發方向是前端語音模組.

而我們知道, 「晶片從流片到量產, 至少還需要 7~8 個月甚至更長的時間. 即便晶片量產後, 還要導入客戶, 根據客戶需求優化產品, 這還要有一個可能更長的周期. 我們都說晶片門檻高, 這個門檻主要是周期長. 這就需要晶片公司有很強的預判能力, 迭代不能錯. 」

對於未來, 「我們看好 AI 這個方向, 公司也支援在這個方向投入人力物力. 」淩雲告訴我們. 但是因為這個方向是嶄新的, 產品要能達到起量, 可能還是需要一段時間的探索.

杭州國芯主打的兩款晶片是 8010 (應用於智能音箱和兒童智能產品, 合作案例 Rokid) , 8008 (應用於電視機頂盒, 家電, 合作案例出門問問) , 當談及國芯近期會不會有新品推出時, 淩雲回答說: 暫時不會. 今年能把手頭這些客戶服務好, 就已經不錯了.

因為地域的原因, Rokid 給了杭州國芯這家老牌企業很多啟發, 算是把他們一隻腳帶進了 AI 領域. 這一代 AI 晶片從立項到量產, 用了兩年的時間, 主要是產品研發的周期長, 立項決策其實是很快的. 兩年前做這個決定時, 國芯對未來沒有把握. 但是現在因為和這些 AI 公司的合作, 信心越來越強了. 淩雲感慨到.

而作為智能硬體設備的設計方, 又該如何做選擇?

針對這個問題, 我們和最近在為自己智能音箱新品選方案的團隊聊了聊.

問: 作為下一個要開發智能產品的團隊, 在選擇使用誰家晶片的問題上, 你評估的標準是什麼?

答: 晶片選擇的核心是成熟度和成本的取捨. 之前的很多音箱用的更多是電視盒子的晶片, 成熟度高, 但是整合度低, 盒子上的 GPU 等部分在音箱上是用不到的, 同時為了掛載多路麥克風還要加額外的元器件, 因此成本普遍偏高. 對於新的晶片, 特別是 AI 專用晶片, 因為是專門的 NPU 做的演算法, 所以首先看的是演算法的成熟度, 其次是看晶片廠商的服務能力, 要能把底層的坑先解決掉.

問: 而對於演算法公司下沉做晶片公司的這股浪潮, 怎麼看?

答: IoT 本身就是面向一個更確定的細分場景去滲透, 音箱這波市場前景很明確, 給了很多演算法公司一個機遇, 所以做晶片或者和晶片公司深度合作, 能夠提升他們的競爭力.

當然我們也得清楚, 像英偉達, 賽靈思這類傳統的晶片公司, 本身演算法也很強大, 晶片和演算法的融合會更強. 即便演算法公司不做晶片, 晶片公司也一直在做演算法.

可以往回看, 最早一波雙攝像頭的方案都是演算法公司做的, 現在基本高通, MTK 這些晶片本身就帶雙攝演算法, 未來在其他領域也一樣. 之前最牛逼的雙攝演算法公司 LINX 直接被蘋果收購了.

在 Rokid 發布會結束後, 一群老友圍在一起各種聊天. 無意中, 聽到 Rokid 的一位早期投資人這樣描述他們對於 Rokid 耗資近千萬開這樣一場發布會的態度, 他說:

還是要支援這些夢想家的.

2016 GoodChinaBrand | ICP: 12011751 | China Exports