'下雨了, 怎麼辦? '
母親關切地說: '記得帶傘, 注意別著涼, 雨太大就打車. '
老闆霸道地說: '快來公司, 別遲到. '
'下雨了, 就淋雨撒!' 面對這個答案, 應該會懷疑是哪位親生的好朋友在惡作劇吧? 不過給出這個答案的並非真人, 而是手機裡的虛擬人工智慧(AI)語音助手.
早些時候, 智能助手只能理解簡單語音指令, 比如搜索關鍵詞, 查詢天氣, 啟動應用等, 實力扮演 '智商受到質疑' 的被調侃者. 面對一些常識性問題, 或者複雜指令往往說完 '不能理解' 就潛水了, 更不要提 '這個, 那個' 等堪稱人工智慧災難的不明指示代詞. 但是近兩年, AI語音助手智商顯著提升, 可以幫你準確找到某年某月某日拍的照片, 還能一句話叫車, 發紅包, 開始導航, 甚至和你 '皮一下' .
AI語音助手得到強化後, 更多用戶得以通過 '一站式' 語音交互取代多步驟的觸控操作, 這也成為產業鏈相關企業完善手機等終端產品語音交互體驗的重要動力. 但想要塑造終端側虛擬AI助手並不容易, 需要提升語音識別準確率, 縮短交互延遲感, '培養' 虛擬助手符合用戶個人屬性. 對此, 高通給出的解決方案是: 讓智能手機等終端用 '芯' 了解用戶.
2007年Qualcomm Research啟動首個人工智慧項目, 到2015年驍龍820移動平台發布, 也是高通第一代人工智慧正式亮相併賦能手機, 走到用戶身邊. 持續在人工智慧領域進行研發投入, 整合強化人工智慧領域前沿研究, 為高通打造強 '芯' 提供了充分技術積累. 2017年, 高通發布了搭載第三代人工智慧的驍龍845移動平台. 手機與AI的結合開始步入蜜月期, 千元機, 旗艦機都打上了AI的標籤. . 如今, 驍龍600以及今年亮相的700系列產品中同樣有Qualcomm AIE(人工智慧引擎)的加持. 所以, 今天搭載驍龍平台, 支援Qualcomm AIE的手機已經能夠在AI拍攝, 智慧場景識別, AI面部識別以及虛擬人工智慧助手等方面為用戶提供更便捷, 智能, 人性化的體驗. 下面我們就通過虛擬人工智慧助手的發展來看, 一顆強 '芯' 如何讓手機更 '聰明' , 如何 '讀懂' 用戶.
解放雙手, 高能效虛擬人工智慧助手引領交互變革
語音相比其他交互方式有一項重要優勢——解放雙手!被鬧鐘叫醒頭腦一片空白卻無論如何也找不到手機時, 通過語音助手只需要動動嘴就能關閉鬧鐘, 美美的睡個回籠覺;在廚房手忙腳亂地準備晚飯時, 利用語音助手告訴在路上的家人, 購買缺少的食材;雙手離不開電腦鍵盤緊張工作時想要來點BGM, 同樣用語音助手一句話就能播放自己最喜歡的音樂…
相比於傳統的雲端AI所支援的語音交互, 終端側處理具備更多特有的優勢, 比如更快的響應速度, 更高的可靠性和個更好的隱私保護. 語音交互帶動終端側交互變革, 提升交互體驗, 讓虛擬人工智慧助手走向成熟, 但在幕後需要終端設備對語音指令, 語義識別有較高的精確度, 避免 '風馬牛不相及' 的尷尬結果. 要實現端到端的語音交互體驗, 是一個複雜的流程, 一般來講, 與終端的語音交互需要多個組件支援, 以實現以下流程: 麥克風採集語音訊號, 下一步進行語音預處理, 語音激活, 語音識別和自然語言理解, 最終是終端通過語音合成的方式響應用戶.
為保證用戶體驗, 虛擬人工智慧助手需要在終端側即時開啟, 然而智能手機等攜帶型終端設備 '續航' 是一份寶貴資源, 所以把控功耗, 散熱十分關鍵. 而高能效正是Qualcomm AI Research的核心研究領域, 在驍龍平台中配備了先進的音頻, 電源管理模組, 此外Qualcomm語音激活(VA)在性能功耗平衡方面處於頂尖水平. 這就為設備 '超長待機' 提供了一份保證, 但是除了控制功耗還需要高識別準確率, 所以語音降噪也是高通重點攻克的難題.
在行駛的汽車中, 嘈雜的工作間, 使用語音助手就需要消除環境噪音, 不然終端識別, 理解語音訊號就會出現偏差, 交互就變成了 '驢唇不對馬嘴' 的溝通. Qualcomm人工智慧研究項目負責人兼工程技術高級總監侯紀磊曾表示: 機器學習的加入提升了終端語音識別準確率, 高通藉助大量語音噪音數據訓練基於深度學習的降噪模型, 可以在頗具挑戰的幹擾及雜訊場景中保持魯棒性, 並且該模型與傳統方法相比有顯著的性能提升, 甚至可在助聽器這樣非常受限的處理能力, 功耗和散熱條件下運行.
可以這樣理解, 降噪後終端分析的語音指令, 傳輸的訊號中關鍵資訊更加明確, 從而準確率大幅提升. 在2018年的CES期間高通演示了智能家居中的端到端語音交互體驗, 在適應口音和環境後, 對特定領域的指令集已經可以實現超過95%的意圖理解準確率.
虛擬人工智慧助手對於AI的應用不僅局限在降噪這一方面, 還包括 '自我進修' . vivo NEX搭載支援Qualcomm AIE的驍龍710移動平台, 擁有Jovi語音助手. 就以利用Jovi給指定聯繫人發送微信資訊為例, 看看虛擬人工智慧助手是怎麼完成自主學習的.
下達指令 '用微信告訴小宏, 不要忘記明早10點開會. ' 手機會按照此前 '經驗' 預設對話涉及聯繫人為 '小紅' (將語音轉換為文字), 進行檢索, 如果目錄中沒有相應聯繫人 '小紅' 則會轉換為拼音 'xiao hong' , 檢索到備註資訊為 '小宏' 的聯繫人確認即可發送消息. 而下一次還是給 '小宏' 發送指令時, 虛擬人工智慧助手則會根據此前學習結果, 直接搜索 '小宏' .
因此, 擁有驍龍 '芯' 支撐的虛擬人工智慧助手不僅初始 '智商' 得到提高, 還會隨著用戶使用深入, 對用戶行為, 習慣有進一步了解, 更加個性化, 自然也就變得 '聰明' 起來.
人性化虛擬人工智慧助手, 讓終端更懂你
我們對於虛擬人工智慧助手的終極期望就是希望它能夠像一個 '活生生的人或者伴侶' , 因此除了幫助我們完成對終端設備操控的同時, 還需要 '主動' , '人性化' 一些. 就像文章開頭讓我們去 '淋雨' 的語音助手, 雖然這個答案玩笑成分居多, 但更加貼近人與人之間的對話. 增強個性化的一大好處在於, 它能夠推動個人助理進一步發展併兼具響應性和主動性. 真正的個人助理不僅能夠在用戶提問時提供個性化的答案, 還能基於情境分析進行自主決策和無提示對話. 日常生活中, 我們需要 '助手' 幫助的主要原因就是——自己拿不定主意, 比如 '午飯吃什麼' , '這件衣服好看麼' …現在虛擬人工智慧助手收到這些問題 '內心' 應該是崩潰的, 但是未來卻不一定.
如果終端可以配備更多感測器(比如虹膜識別, 溫度), 性能更強大的核 '芯' 平台, 更穩定暢快的連接(5G)以及更先進的深度學習能力, 終端在保證隱私安全的前提下, 那麼虛擬人工智慧助手將具備更鮮明 '私人屬性' . 現在高通對於終端側人工智慧, 虛擬人工智慧助手的探索正在向著 '人性化' 方向努力. Qualcomm人工智慧研究項目負責人兼工程技術高級總監侯紀磊認為, 真正的個人助理是響應式和主動式的, 不僅可以完成用戶指令, 還能基於情景在分析用戶潛在需求, 主動開始 '對話' , 像一位真正的朋友陪在身邊.
為了塑造人性化, 高通為虛擬人工智慧助手增加 'AI agent' , 以更詳細的用戶數據, 行為分析實現直觀應對, 例如加入情緒分類, 基於情景式融合與學習等等. 這就需要手機更加智能的為用戶建造 '私人資料庫' , 比如身份, 年齡, 使用習慣等等. 目前支援Qualcomm AIE的智能手機已配備部分相關功能, 比如AI面部識別可以判斷性別年齡;智慧場景分析會基於使用習慣推薦相應內容, 應用;又或者是剛剛提到不斷進化升級的語音助手.
Qualcomm AIE賦能的終端設備不僅賦予虛擬人工智慧助手靈敏 '聽覺' , 還有 '視覺' . 仍舊以vivo NEX的 'Jovi' 為例, 通過智慧識圖不僅可以分析圖片中文本資訊, 還可以對圖片資訊分析為用戶 '科普' 或者提供購買資訊.
也就是說, 越來越多的功能通過虛擬人工智慧助手被整合到了一起, 高通憑藉一顆強 '芯' 和領先演算法支援, 讓我們的手機越來越 '聰明' . Qualcomm AIE, 驍龍 '芯' 等AI相關先進研究成果還將覆蓋到物聯網, 車聯網, 智慧家庭, 智慧城市等更多領域. 因為萬物互聯時代, 人類渴望與終端的自然交互並不局限於智能手機, 還包括智能音箱, 擴展現實(XR)設備, 汽車等, 比如與汽車 '對話' 可以更及時準確地調整導航線路;與擴展現實(XR)設備 '對話' 可以降低體驗門檻, 提升交互沉浸感, 精確度;與智能音箱等智能家居產品 '對話' 則是我們一直期盼的 '智慧家庭' 重要組成部分.
展望未來, 人性化虛擬人工智慧助手不僅擔任家中智能的管家, 車內智慧的嚮導, 手機中 '聰明' 的秘書, 還有可能成為每個人的 '數字化投影' .