AI+电脑视觉 | 加速机器人和智能家庭进展

Liran Bar, CEVA成像与视觉DSP核心产品线总监

每年的CES都会出现一些令人惊叹的技术, 包括汽车, 智能机器人, 无人机, AR/VR以及智能家电创新等. 从昂贵的未来派玩具演进到实际可用的装置是令人激动的, 今年在这方面也有重大进展. 本文探讨哪些采用AI和电脑视觉的消费装置将会成为主流.

每年我们都会在国际消费电子展(CES)上看到一些令人惊叹的技术, 包括汽车, 智能机器人, 无人机, 扩增实境/虚拟实境(AR/VR), 智能家电领域的创新和许多其他技术. 从昂贵的未来派玩具演进到实际有用的装置是令人激动的, 今年在这一方向上取得了重大进展, 当然还是有一些言过其实, 只是作秀的小玩意儿. 本文将探讨哪些采用人工智能(AI)和电脑视觉的消费装置将会成为主流.

以摄影机为眼+内建AI智能

自2014亚马逊(Amazon)首次推出Echo以来, 语音介面已经在过去几年内被广泛采用. 今年很明确的一点是, 为了达到更高的水准, 必须在边缘装置(edge device)采用视觉和人工智能技术. 今年的CES展会上有不计其数包含摄影机的机器人, 其中还有一些特别突出的产品.

Omron Forpheus采用AI技术打乒乓球

机器人公司欧姆龙(Omron)透过生动有趣的方式展示其技术——这是一款名叫Forpheus的机器人乒乓球大师. 该机器人使用两个摄影机来追踪球的位置和速度, 采用专利的预测模型计算球的运动轨迹, 以保持与人类对手的来回对抗. 还有一个额外的摄影机追踪人类玩家的脸部表情, 判断他们是否享受这一游戏过程, 以确保这是一场有趣的比赛. 虽然这并不意味着它是一个商用产品, 但是表明人工智能, 感测和先进的机器人技术可以应用于各种工业和消费功能上.

并不是所有的展示都像Forpheus的乒乓球技术一样流畅. LG发布的智能家庭机器人CLOi, 就出现了一些尴尬的时刻, 例如机器人没有回应语音指令等. 拥有类似外观的Jibo展现其社交技能, 包括脸部辨识. 该装置自去年10月开始销售, 它采用一种与主流智能音箱不同的途径, 使其更定位于社交, 并能与用户进行个性化的互动. SLAMtec也展示一些机器人, 其特点是Slam定位和导航解决方案, 例如其中的通用的机器人平台——宙斯(Zeus). UbTech Robotics公司去年发布了Alexa驱动的人形机器人Lynx, 今年则推出了可以爬楼梯和踢足球的两足机器人.

从左到右依序是SLAMtec, Jibo和视觉机器人Lynx (来源: CEVA)

Sony在90年代末推出的机器人宠物狗Aibo, 最近正以全新且更先进的版本重回人们的视线. 它包含两个摄影机和多个感测器, 从而可以辨识主人并且对触摸和声音做出反应.

另一个和宠物相关的创新产品是互动式Wi-Fi宠物相机Petcube, 它可以让用户远端检查宠物的状况. 其中一款型号的宠物相机甚至可以让你晃一晃手指就能为宠物准备好一顿饭.

虚拟实境何时起飞?

至于虚拟实境市场的创新, 我们看到了稳步地成长, 但仍未像预期一样爆发. 这主要是由于存在一些困难的挑战, 例如有限的运算资源, 功耗, 自内向外追踪(inside-out tracking)和内容品质的限制.

在CES 2018上, 宏达国际电子(HTC)发布了HTC Vive Pro, 支援高解析度和低延迟, 但更重要的是它能够直接将内容串流传输到头戴式装置上, 而不必像其他装置一样需要使用电缆. 相较于HTC Vive, Vive Pro看起来更大, 而且由于价格昂贵, 所以主要针对高阶专业用户.

无线的头戴式显示装置(HMD)——HTC Vive Pro (来源: HTC)

虚拟实境技术的新应用之一是Google VR180, 可望成为主流消费产品. 它采用创新的方式利用双目立体相机技术撷取3D影像. 并以180度的拍摄角度, 取代不方便透过正常视角观看的360度. 致力于拍摄这种新格式的两款产品是联想(Lenovo)的Mirage相机, 以及小蚁(Yi) Horizon VR180相机. 用户可以透过Google Daydream VR头戴式显示装置(HMD)观看3D照片, 或是在任何荧幕上观看2D照片.

无人驾驶车大出锋头

无人驾驶车已经成为过去几届CES大会上最具吸引力的展示之一. 今年, 汽车专家认为无人驾驶车已经是既定现实, 转而开始寻找必要的服务和应用, 以满足人类无需开车时产生的新需求. 例如, 福特(Ford Motor)执行长Jim Hackett在主题演讲中将整个自动驾驶车驱动的生态系统称为 '生活街' (the living street). 丰田(Toyota Motor)的e-Palette概念车也传递了类似的讯息, 描绘车辆在没有驾驶人的情况下, 拥有从行动赌场和餐厅到共乘服务和货物运输的多用途和模组化配置.

在自主航空领域, 贝尔直升机(Bell Helicopter)公司展示如何在类似计程车的电动直升机中实现无人驾驶飞行的旅程.

这些例子证明每个人都清楚地认识到无人驾驶车的革命正在发生. 唯一的问题是一旦它实现了, 我们的城市将会是什么样子?

Bell空中计程车提供了自动驾驶直升机的缩影

智能朝向边缘发展

人工智能在过去几年的爆发式发展, 可说是网际网络最直接的成果. 过去, 个人电脑(PC)和手持装置还不够强大到足以支援深度学习, 所以像是Google和亚马逊等大型公司使用巨大的伺服器中心在云端处理数据. 这种方法的优点是实现几乎无穷尽的运算能力, 而不需要考虑哪一种特定装置采用的处理器. 但是缺点也有很多. 首先是数据传输的延迟, 会随着网络覆盖状况而发生变化, 更不用提在没有网络覆盖的情况了. 更重要的是云端处理的缺点——隐私和安全的问题. 因此, 当处理敏感资讯时, 最好保持在装置上, 而不是发送到安全性薄弱的外部.

这些理由清楚地表明使用云端处理深度学习只是一个临时方案. 一旦嵌入式平台可以提供足够的性能支援人工智能处理, 就会开始在边缘装置上执行. 你可能想知道嵌入式平台什么时候才够强大能实现这一愿景, 答案是它们已经到位了. 最新的旗舰级手机, 像iPhone X上的嵌入式神经引擎能够在本地辨识人脸来解锁手机, 而无需再发送资讯到云端.

其他还有许多的人工智能特性也可以在终端装置上实现, 特别是透过强大和高效的数位讯号处理器(DSP)以及基于向量处理器的专用深度学习引擎. 先进的处理和节能技术使这些系统比绘图处理器(GPU)和其他用于远端伺服器的处理器消耗更少的功耗, 所以即使是小型, 以电池驱动的装置也可以使用人工智能处理器, 而不必依赖云端. 例如NeuPro人工智能系列处理器搭配软体和硬体工具, 能够实现嵌入式智能和更流畅的开发周期.

针对嵌入式装置的自主专用人工智能处理器NeuPro

2016 GoodChinaBrand | ICP: 12011751 | China Exports