AI+電腦視覺 | 加速機器人和智能家庭進展【中国好品牌网】

Liran Bar, CEVA成像與視覺DSP核心產品線總監

每年的CES都會出現一些令人驚歎的技術, 包括汽車, 智能機器人, 無人機, AR/VR以及智能家電創新等. 從昂貴的未來派玩具演化到實際可用的裝置是令人激動的, 今年在這方面也有重大進展. 本文探討哪些採用AI和電腦視覺的消費裝置將會成為主流.

每年我們都會在國際消費電子展(CES)上看到一些令人驚歎的技術, 包括汽車, 智能機器人, 無人機, 擴增實境/虛擬實境(AR/VR), 智能家電領域的創新和許多其他技術. 從昂貴的未來派玩具演化到實際有用的裝置是令人激動的, 今年在這一方向上取得了重大進展, 當然還是有一些言過其實, 只是作秀的小玩意兒. 本文將探討哪些採用人工智慧(AI)和電腦視覺的消費裝置將會成為主流.

以攝影機為眼+內建AI智能

自2014亞馬遜(Amazon)首次推出Echo以來, 語音介面已經在過去幾年內被廣泛採用. 今年很明確的一點是, 為了達到更高的水準, 必須在邊緣裝置(edge device)採用視覺和人工智慧技術. 今年的CES展會上有不計其數包含攝影機的機器人, 其中還有一些特別突出的產品.

Omron Forpheus採用AI技術打乒乓球

機器人公司歐姆龍(Omron)透過生動有趣的方式展示其技術——這是一款名叫Forpheus的機器人乒乓球大師. 該機器人使用兩個攝影機來追蹤球的位置和速度, 採用專利的預測模型計算球的運動軌跡, 以保持與人類對手的來回對抗. 還有一個額外的攝影機追蹤人類玩家的臉部表情, 判斷他們是否享受這一遊戲過程, 以確保這是一場有趣的比賽. 雖然這並不意味著它是一個商用產品, 但是表明人工智慧, 感測和先進的機器人技術可以應用於各種工業和消費功能上.

並不是所有的展示都像Forpheus的乒乓球技術一樣流暢. LG發布的智能家庭機器人CLOi, 就出現了一些尷尬的時刻, 例如機器人沒有回應語音指令等. 擁有類似外觀的Jibo展現其社交技能, 包括臉部辨識. 該裝置自去年10月開始銷售, 它採用一種與主流智能音箱不同的途徑, 使其更定位於社交, 並能與用戶進行個性化的互動. SLAMtec也展示一些機器人, 其特點是Slam定位和導航解決方案, 例如其中的通用的機器人平台——宙斯(Zeus). UbTech Robotics公司去年發布了Alexa驅動的人形機器人Lynx, 今年則推出了可以爬樓梯和踢足球的兩足機器人.

從左到右依序是SLAMtec, Jibo和視覺機器人Lynx (來源: CEVA)

Sony在90年代末推出的機器人寵物狗Aibo, 最近正以全新且更先進的版本重回人們的視線. 它包含兩個攝影機和多個感測器, 從而可以辨識主人並且對觸摸和聲音做出反應.

另一個和寵物相關的創新產品是互動式Wi-Fi寵物相機Petcube, 它可以讓用戶遠端檢查寵物的狀況. 其中一款型號的寵物相機甚至可以讓你晃一晃手指就能為寵物準備好一頓飯.

虛擬實境何時起飛?

至於虛擬實境市場的創新, 我們看到了穩步地成長, 但仍未像預期一樣爆發. 這主要是由於存在一些困難的挑戰, 例如有限的運算資源, 功耗, 自內向外追蹤(inside-out tracking)和內容品質的限制.

在CES 2018上, 宏達國際電子(HTC)發布了HTC Vive Pro, 支援高解析度和低延遲, 但更重要的是它能夠直接將內容串流傳輸到頭戴式裝置上, 而不必像其他裝置一樣需要使用電纜. 相較於HTC Vive, Vive Pro看起來更大, 而且由於價格昂貴, 所以主要針對高階專業用戶.

無線的頭戴式顯示裝置(HMD)——HTC Vive Pro (來源: HTC)

虛擬實境技術的新應用之一是Google VR180, 可望成為主流消費產品. 它採用創新的方式利用雙目立體相機技術擷取3D影像. 並以180度的拍攝角度, 取代不方便透過正常視角觀看的360度. 致力於拍攝這種新格式的兩款產品是聯想(Lenovo)的Mirage相機, 以及小蟻(Yi) Horizon VR180相機. 用戶可以透過Google Daydream VR頭戴式顯示裝置(HMD)觀看3D照片, 或是在任何熒幕上觀看2D照片.

無人駕駛車大出鋒頭

無人駕駛車已經成為過去幾屆CES大會上最具吸引力的展示之一. 今年, 汽車專家認為無人駕駛車已經是既定現實, 轉而開始尋找必要的服務和應用, 以滿足人類無需開車時產生的新需求. 例如, 福特(Ford Motor)執行長Jim Hackett在主題演講中將整個自動駕駛車驅動的生態系統稱為 '生活街' (the living street). 豐田(Toyota Motor)的e-Palette概念車也傳遞了類似的訊息, 描繪車輛在沒有駕駛人的情況下, 擁有從行動賭場和餐廳到共乘服務和貨物運輸的多用途和模組化配置.

在自主航空領域, 貝爾直升機(Bell Helicopter)公司展示如何在類似計程車的電動直升機中實現無人駕駛飛行的旅程.

這些例子證明每個人都清楚地認識到無人駕駛車的革命正在發生. 唯一的問題是一旦它實現了, 我們的城市將會是什麼樣子?

Bell空中計程車提供了自動駕駛直升機的縮影

智能朝向邊緣發展

人工智慧在過去幾年的爆髮式發展, 可說是網際網路最直接的成果. 過去, 個人電腦(PC)和手持裝置還不夠強大到足以支援深度學習, 所以像是Google和亞馬遜等大型公司使用巨大的伺服器中心在雲端處理數據. 這種方法的優點是實現幾乎無窮盡的運算能力, 而不需要考慮哪一種特定裝置採用的處理器. 但是缺點也有很多. 首先是數據傳輸的延遲, 會隨著網路覆蓋狀況而發生變化, 更不用提在沒有網路覆蓋的情況了. 更重要的是雲端處理的缺點——隱私和安全的問題. 因此, 當處理敏感資訊時, 最好保持在裝置上, 而不是發送到安全性薄弱的外部.

這些理由清楚地表明使用雲端處理深度學習只是一個臨時方案. 一旦嵌入式平台可以提供足夠的性能支援人工智慧處理, 就會開始在邊緣裝置上執行. 你可能想知道嵌入式平台什麼時候才夠強大能實現這一願景, 答案是它們已經到位了. 最新的旗艦級手機, 像iPhone X上的嵌入式神經引擎能夠在本地辨識人臉來解鎖手機, 而無需再發送資訊到雲端.

其他還有許多的人工智慧特性也可以在終端裝置上實現, 特別是透過強大和高效的數位訊號處理器(DSP)以及基於向量處理器的專用深度學習引擎. 先進的處理和節能技術使這些系統比繪圖處理器(GPU)和其他用於遠端伺服器的處理器消耗更少的功耗, 所以即使是小型, 以電池驅動的裝置也可以使用人工智慧處理器, 而不必依賴雲端. 例如NeuPro人工智慧系列處理器搭配軟體和硬體工具, 能夠實現嵌入式智能和更流暢的開發周期.

針對嵌入式裝置的自主專用人工智慧處理器NeuPro