炎热的夏天, 忙碌了一天之后, 拖着疲惫的身子下班回家, 打开门, 打开玄关的灯, 奔向松软的沙发, 此刻你只想好好休息或者看个电视, 结果怎么也找不到电视和空调遥控器了……
寒冷的冬天, 洗漱完毕, 上床打开灯看了会儿书, 再看会儿手机, 被窝里也暖了. 刚想躺下睡觉, 发现客厅或卫生间的灯没有关……
这些场景时常会出现在我们的日常生活中, 而智能音箱所提供的语音交互被认为是解决这种现状的最好方式.
2017年双11, 智能音箱在国内迎来了一个重要的发展节点, 阿里对外宣布 '天猫精灵' 卖了100万台, 京东的 '叮咚音箱' 也实现了同比3位数的增长, 还有其他智能音箱玩家也都或多或少分到了羹. 百万量级成功让国内市场获得了一张智能音箱的入场券.
经过一年的沉淀, 目前中国智能音箱市场集齐了四路玩家: 软件平台厂商, 包含了腾讯, 百度, 阿里巴巴, 京东, 猎豹等;智能硬件厂商, 以小米, 华为为典型;大型家电厂商, 以海尔为典型;其他则有Rokid, 出门问问, 喜马拉雅等创业型企业. 据不完全统计, 目前, 已经发布智能音箱产品的企业有近50家, 还有至少500家与之相关的硬件企业或技术提供商活跃在前沿阵线.
智能音箱之所以成为 '大佬' 争抢的焦点, 一方面是由于它涉及领域广, 容易找到切入点和突破口, 如单品与平台;另一方面也是由于市场潜力巨大, 人人都有可能分一杯羹. 奥维云网数据显示, 2017年我国市场销量达到176万台, 销售额4.9亿. 预计2018年的市场销售量425万台, 同比增长141%, 销售额13.6亿元, 同比增长178%.
表面上看, 众多企业麓战正酣, 事实上, 智能音箱依然没有摆脱 '叫好不叫座' 的尴尬境地.
锤子科技前CTO钱晨曾表示, 百家争鸣的背后, 智能音箱的概念可能被玩儿坏. 也有人断言, 中国智能音箱看上去似乎很热, 但大多都将走向消亡.
原因有二, 其一是国内智能音箱市场走的是低价快速渗透策略, 不以盈利为导向, 将产品定价一低再低, 这与正常的市场规则背道而驰. 如, 原价499元天猫精灵仅售99元, 定价299元的叮咚top卖出49元的白菜价. 声智科技董事长兼CEO陈孝良曾表示, 烧钱加快市场认知和快速铺量的过程, 对于培养用户大有裨益. 但是产品的出路肯定不是烧钱, 最终是挖掘和满足用户体验的问题.
其二, 行业正在面临创新能力弱, 产品体验差, 内容和功能不丰富, 用户认知度低等诸多问题. 一项来自奥维云网(AVC)的调研表明, 中国57%的消费者听说过智能音箱, 23%的消费者对智能音箱有一定了解, 但消费者在购买之后的使用频次和时长并不理想.
显然, 智能音箱想要真正引爆中国市场还需要太长的路要走. 那么当下, 如何冲破其 '叫好不叫座' 的怪圈呢?
首先, 技术层面的突破是智能音箱发展需要迈进的一步.
在人机交互方面, 语音技术是硬功夫, 唤醒激活的设备数越多, 用户使用频次越多, 语音识别能力, 反应速度, 学习能力训练得越好, 产品快速占领市场的可能性越大.
目前来看, 智能音箱的语音交互只能进行模式化的应对, 相对单调呆板. 跨场景, 跨任务的对话经常进行不下去, 对上下文信息的理解能力较弱. 除了语音识别之外, 语义理解是目前各大企业需要攻克的技术难关.
微软亚洲研究院院长洪小文博士指出, 要做到百分之百的语义理解, 是一个AI complete问题, 只有解决了其他AI的问题才可能有解. '比如, 你去参加一个鸡尾酒会, 周围非常嘈杂, 你讲的话里面十个有九个字我都没有听清, 可是因为你讲的内容我大概知道, 所以即使我听不清还是能够猜出你讲的是什么. 但如果用语音识别和语义理解, 可能会失败. 在具体的应用场景, 除了语音, 还包括视觉, 知识的综合使用, 这是语音人工智能未来的挑战. '
其次, 做出黏住用户的产品才有意义. 寻找适合国内用户普遍的刚需性场景与痛点性问题将是关键, 它事关智能音箱这场百箱大战是否会延续过去高科技被玩成白菜价之后整个行业被玩坏, 多数厂商出局的老路子, 也决定巨头们由智能音箱衍生出来的语音交互平台会不会成为下一代操作系统的关键.
目前, 无论是功能还是其背后的服务, 智能音箱并没有真正抓住用户痛点. 比如, 对音乐要求高的用户来说, 智能音箱的音质无法满足需求. 而对音乐要求没那么高的用户来说, 普通蓝牙音箱更经济实惠.
猎豹移动董事兼高级副总裁周品认为, 中场过后, 智能音箱产品的逻辑将回归声音的本质, 在音质和音乐的来源上进行深度布局, 用音质去吸引和打动用户在音箱上的原始需求.
在杭州的创业公司Rokid副总裁向文杰看来, 未来智能音箱发展有两个方向: 偏互联网玩法, 降低音箱价格, 把产品 '送' 出去, 以此来完善自身的业务链条或者将产品平台化, '散' 出去, 提升用户体验, 让用户离不开智能音箱.
总的来说, 市场潜在需求一直存在, 让用户真正体验到通过语音感受到人机交互的乐趣与体验的快乐, 才能以高维打低维, 快速破局.