'下雨了, 怎么办? '
母亲关切地说: '记得带伞, 注意别着凉, 雨太大就打车. '
老板霸道地说: '快来公司, 别迟到. '
'下雨了, 就淋雨撒!' 面对这个答案, 应该会怀疑是哪位亲生的好朋友在恶作剧吧? 不过给出这个答案的并非真人, 而是手机里的虚拟人工智能(AI)语音助手.
早些时候, 智能助手只能理解简单语音指令, 比如搜索关键词, 查询天气, 启动应用等, 实力扮演 '智商受到质疑' 的被调侃者. 面对一些常识性问题, 或者复杂指令往往说完 '不能理解' 就潜水了, 更不要提 '这个, 那个' 等堪称人工智能灾难的不明指示代词. 但是近两年, AI语音助手智商显著提升, 可以帮你准确找到某年某月某日拍的照片, 还能一句话叫车, 发红包, 开始导航, 甚至和你 '皮一下' .
AI语音助手得到强化后, 更多用户得以通过 '一站式' 语音交互取代多步骤的触控操作, 这也成为产业链相关企业完善手机等终端产品语音交互体验的重要动力. 但想要塑造终端侧虚拟AI助手并不容易, 需要提升语音识别准确率, 缩短交互延迟感, '培养' 虚拟助手符合用户个人属性. 对此, 高通给出的解决方案是: 让智能手机等终端用 '芯' 了解用户.
2007年Qualcomm Research启动首个人工智能项目, 到2015年骁龙820移动平台发布, 也是高通第一代人工智能正式亮相并赋能手机, 走到用户身边. 持续在人工智能领域进行研发投入, 整合强化人工智能领域前沿研究, 为高通打造强 '芯' 提供了充分技术积累. 2017年, 高通发布了搭载第三代人工智能的骁龙845移动平台. 手机与AI的结合开始步入蜜月期, 千元机, 旗舰机都打上了AI的标签. . 如今, 骁龙600以及今年亮相的700系列产品中同样有Qualcomm AIE(人工智能引擎)的加持. 所以, 今天搭载骁龙平台, 支持Qualcomm AIE的手机已经能够在AI拍摄, 智慧场景识别, AI面部识别以及虚拟人工智能助手等方面为用户提供更便捷, 智能, 人性化的体验. 下面我们就通过虚拟人工智能助手的发展来看, 一颗强 '芯' 如何让手机更 '聪明' , 如何 '读懂' 用户.
解放双手, 高能效虚拟人工智能助手引领交互变革
语音相比其他交互方式有一项重要优势——解放双手!被闹钟叫醒头脑一片空白却无论如何也找不到手机时, 通过语音助手只需要动动嘴就能关闭闹钟, 美美的睡个回笼觉;在厨房手忙脚乱地准备晚饭时, 利用语音助手告诉在路上的家人, 购买缺少的食材;双手离不开电脑键盘紧张工作时想要来点BGM, 同样用语音助手一句话就能播放自己最喜欢的音乐…
相比于传统的云端AI所支持的语音交互, 终端侧处理具备更多特有的优势, 比如更快的响应速度, 更高的可靠性和个更好的隐私保护. 语音交互带动终端侧交互变革, 提升交互体验, 让虚拟人工智能助手走向成熟, 但在幕后需要终端设备对语音指令, 语义识别有较高的精确度, 避免 '风马牛不相及' 的尴尬结果. 要实现端到端的语音交互体验, 是一个复杂的流程, 一般来讲, 与终端的语音交互需要多个组件支持, 以实现以下流程: 麦克风采集语音信号, 下一步进行语音预处理, 语音激活, 语音识别和自然语言理解, 最终是终端通过语音合成的方式响应用户.
为保证用户体验, 虚拟人工智能助手需要在终端侧实时开启, 然而智能手机等便携式终端设备 '续航' 是一份宝贵资源, 所以把控功耗, 散热十分关键. 而高能效正是Qualcomm AI Research的核心研究领域, 在骁龙平台中配备了先进的音频, 电源管理模块, 此外Qualcomm语音激活(VA)在性能功耗平衡方面处于顶尖水平. 这就为设备 '超长待机' 提供了一份保证, 但是除了控制功耗还需要高识别准确率, 所以语音降噪也是高通重点攻克的难题.
在行驶的汽车中, 嘈杂的工作间, 使用语音助手就需要消除环境噪音, 不然终端识别, 理解语音信号就会出现偏差, 交互就变成了 '驴唇不对马嘴' 的沟通. Qualcomm人工智能研究项目负责人兼工程技术高级总监侯纪磊曾表示: 机器学习的加入提升了终端语音识别准确率, 高通借助大量语音噪音数据训练基于深度学习的降噪模型, 可以在颇具挑战的干扰及噪声场景中保持鲁棒性, 并且该模型与传统方法相比有显著的性能提升, 甚至可在助听器这样非常受限的处理能力, 功耗和散热条件下运行.
可以这样理解, 降噪后终端分析的语音指令, 传输的信号中关键信息更加明确, 从而准确率大幅提升. 在2018年的CES期间高通演示了智能家居中的端到端语音交互体验, 在适应口音和环境后, 对特定领域的指令集已经可以实现超过95%的意图理解准确率.
虚拟人工智能助手对于AI的应用不仅局限在降噪这一方面, 还包括 '自我进修' . vivo NEX搭载支持Qualcomm AIE的骁龙710移动平台, 拥有Jovi语音助手. 就以利用Jovi给指定联系人发送微信信息为例, 看看虚拟人工智能助手是怎么完成自主学习的.
下达指令 '用微信告诉小宏, 不要忘记明早10点开会. ' 手机会按照此前 '经验' 默认对话涉及联系人为 '小红' (将语音转换为文字), 进行检索, 如果目录中没有相应联系人 '小红' 则会转换为拼音 'xiao hong' , 检索到备注信息为 '小宏' 的联系人确认即可发送消息. 而下一次还是给 '小宏' 发送指令时, 虚拟人工智能助手则会根据此前学习结果, 直接搜索 '小宏' .
因此, 拥有骁龙 '芯' 支撑的虚拟人工智能助手不仅初始 '智商' 得到提高, 还会随着用户使用深入, 对用户行为, 习惯有进一步了解, 更加个性化, 自然也就变得 '聪明' 起来.
人性化虚拟人工智能助手, 让终端更懂你
我们对于虚拟人工智能助手的终极期望就是希望它能够像一个 '活生生的人或者伴侣' , 因此除了帮助我们完成对终端设备操控的同时, 还需要 '主动' , '人性化' 一些. 就像文章开头让我们去 '淋雨' 的语音助手, 虽然这个答案玩笑成分居多, 但更加贴近人与人之间的对话. 增强个性化的一大好处在于, 它能够推动个人助理进一步发展并兼具响应性和主动性. 真正的个人助理不仅能够在用户提问时提供个性化的答案, 还能基于情境分析进行自主决策和无提示对话. 日常生活中, 我们需要 '助手' 帮助的主要原因就是——自己拿不定主意, 比如 '午饭吃什么' , '这件衣服好看么' …现在虚拟人工智能助手收到这些问题 '内心' 应该是崩溃的, 但是未来却不一定.
如果终端可以配备更多传感器(比如虹膜识别, 温度), 性能更强大的核 '芯' 平台, 更稳定畅快的连接(5G)以及更先进的深度学习能力, 终端在保证隐私安全的前提下, 那么虚拟人工智能助手将具备更鲜明 '私人属性' . 现在高通对于终端侧人工智能, 虚拟人工智能助手的探索正在向着 '人性化' 方向努力. Qualcomm人工智能研究项目负责人兼工程技术高级总监侯纪磊认为, 真正的个人助理是响应式和主动式的, 不仅可以完成用户指令, 还能基于情景在分析用户潜在需求, 主动开始 '对话' , 像一位真正的朋友陪在身边.
为了塑造人性化, 高通为虚拟人工智能助手增加 'AI agent' , 以更详细的用户数据, 行为分析实现直观应对, 例如加入情绪分类, 基于情景式融合与学习等等. 这就需要手机更加智能的为用户建造 '私人数据库' , 比如身份, 年龄, 使用习惯等等. 目前支持Qualcomm AIE的智能手机已配备部分相关功能, 比如AI面部识别可以判断性别年龄;智慧场景分析会基于使用习惯推荐相应内容, 应用;又或者是刚刚提到不断进化升级的语音助手.
Qualcomm AIE赋能的终端设备不仅赋予虚拟人工智能助手灵敏 '听觉' , 还有 '视觉' . 仍旧以vivo NEX的 'Jovi' 为例, 通过智慧识图不仅可以分析图片中文本信息, 还可以对图片信息分析为用户 '科普' 或者提供购买信息.
也就是说, 越来越多的功能通过虚拟人工智能助手被整合到了一起, 高通凭借一颗强 '芯' 和领先算法支持, 让我们的手机越来越 '聪明' . Qualcomm AIE, 骁龙 '芯' 等AI相关先进研究成果还将覆盖到物联网, 车联网, 智慧家庭, 智慧城市等更多领域. 因为万物互联时代, 人类渴望与终端的自然交互并不局限于智能手机, 还包括智能音箱, 扩展现实(XR)设备, 汽车等, 比如与汽车 '对话' 可以更及时准确地调整导航线路;与扩展现实(XR)设备 '对话' 可以降低体验门槛, 提升交互沉浸感, 精确度;与智能音箱等智能家居产品 '对话' 则是我们一直期盼的 '智慧家庭' 重要组成部分.
展望未来, 人性化虚拟人工智能助手不仅担任家中智能的管家, 车内智慧的向导, 手机中 '聪明' 的秘书, 还有可能成为每个人的 '数字化投影' .