炎熱的夏天, 忙碌了一天之後, 拖著疲憊的身子下班回家, 開啟門, 開啟玄關的燈, 奔向鬆軟的沙發, 此刻你只想好好休息或者看個電視, 結果怎麼也找不到電視和空調遙控器了……
寒冷的冬天, 洗漱完畢, 上床開啟燈看了會兒書, 再看會兒手機, 被窩裡也暖了. 剛想躺下睡覺, 發現客廳或衛生間的燈沒有關……
這些場景時常會出現在我們的日常生活中, 而智能音箱所提供的語音交互被認為是解決這種現狀的最好方式.
2017年雙11, 智能音箱在國內迎來了一個重要的發展節點, 阿里對外宣布 '天貓精靈' 賣了100萬台, 京東的 '叮咚音箱' 也實現了同比3位數的增長, 還有其他智能音箱玩家也都或多或少分到了羹. 百萬量級成功讓國內市場獲得了一張智能音箱的入場券.
經過一年的沉澱, 目前中國智能音箱市場集齊了四路玩家: 軟體平台廠商, 包含了騰訊, 百度, 阿里巴巴, 京東, 獵豹等;智能硬體廠商, 以小米, 華為為典型;大型家電廠商, 以海爾為典型;其他則有Rokid, 出門問問, 喜馬拉雅等創業型企業. 據不完全統計, 目前, 已經發布智能音箱產品的企業有近50家, 還有至少500家與之相關的硬體企業或技術提供商活躍在前沿陣線.
智能音箱之所以成為 '大佬' 爭搶的焦點, 一方面是由於它涉及領域廣, 容易找到切入點和突破口, 如單品與平台;另一方面也是由於市場潛力巨大, 人人都有可能分一杯羹. 奧維雲網數據顯示, 2017年我國市場銷量達到176萬台, 銷售額4.9億. 預計2018年的市場銷售量425萬台, 同比增長141%, 銷售額13.6億元, 同比增長178%.
表面上看, 眾多企業麓戰正酣, 事實上, 智能音箱依然沒有擺脫 '叫好不叫座' 的尷尬境地.
鎚子科技前CTO錢晨曾表示, 百家爭鳴的背後, 智能音箱的概念可能被玩兒壞. 也有人斷言, 中國智能音箱看上去似乎很熱, 但大多都將走向消亡.
原因有二, 其一是國內智能音箱市場走的是低價快速滲透策略, 不以盈利為導向, 將產品定價一低再低, 這與正常的市場規則背道而馳. 如, 原價499元天貓精靈僅售99元, 定價299元的叮咚top賣出49元的白菜價. 聲智科技董事長兼CEO陳孝良曾表示, 燒錢加快市場認知和快速鋪量的過程, 對於培養用戶大有裨益. 但是產品的出路肯定不是燒錢, 最終是挖掘和滿足用戶體驗的問題.
其二, 行業正在面臨創新能力弱, 產品體驗差, 內容和功能不豐富, 用戶認知度低等諸多問題. 一項來自奧維雲網(AVC)的調研表明, 中國57%的消費者聽說過智能音箱, 23%的消費者對智能音箱有一定了解, 但消費者在購買之後的使用頻次和時長並不理想.
顯然, 智能音箱想要真正引爆中國市場還需要太長的路要走. 那麼當下, 如何衝破其 '叫好不叫座' 的怪圈呢?
首先, 技術層面的突破是智能音箱發展需要邁進的一步.
在人機交互方面, 語音技術是硬功夫, 喚醒激活的設備數越多, 用戶使用頻次越多, 語音識別能力, 反應速度, 學習能力訓練得越好, 產品快速佔領市場的可能性越大.
目前來看, 智能音箱的語音交互只能進行模式化的應對, 相對單調呆板. 跨場景, 跨任務的對話經常進行不下去, 對上下文資訊的理解能力較弱. 除了語音識別之外, 語義理解是目前各大企業需要攻克的技術難關.
微軟亞洲研究院院長洪小文博士指出, 要做到百分之百的語義理解, 是一個AI complete問題, 只有解決了其他AI的問題才可能有解. '比如, 你去參加一個雞尾酒會, 周圍非常嘈雜, 你講的話裡面十個有九個字我都沒有聽清, 可是因為你講的內容我大概知道, 所以即使我聽不清還是能夠猜出你講的是什麼. 但如果用語音識別和語義理解, 可能會失敗. 在具體的應用場景, 除了語音, 還包括視覺, 知識的綜合使用, 這是語音人工智慧未來的挑戰. '
其次, 做出黏住用戶的產品才有意義. 尋找適合國內用戶普遍的剛需性場景與痛點性問題將是關鍵, 它事關智能音箱這場百箱大戰是否會延續過去高科技被玩成白菜價之後整個行業被玩壞, 多數廠商出局的老路子, 也決定巨頭們由智能音箱衍生出來的語音交互平台會不會成為下一代作業系統的關鍵.
目前, 無論是功能還是其背後的服務, 智能音箱並沒有真正抓住用戶痛點. 比如, 對音樂要求高的用戶來說, 智能音箱的音質無法滿足需求. 而對音樂要求沒那麼高的用戶來說, 普通藍芽音箱更經濟實惠.
獵豹移動董事兼高級副總裁周品認為, 中場過後, 智能音箱產品的邏輯將回歸聲音的本質, 在音質和音樂的來源上進行深度布局, 用音質去吸引和打動用戶在音箱上的原始需求.
在杭州的創業公司Rokid副總裁向文傑看來, 未來智能音箱發展有兩個方向: 偏互聯網玩法, 降低音箱價格, 把產品 '送' 出去, 以此來完善自身的業務鏈條或者將產品平台化, '散' 出去, 提升用戶體驗, 讓用戶離不開智能音箱.
總的來說, 市場潛在需求一直存在, 讓用戶真正體驗到通過語音感受到人機交互的樂趣與體驗的快樂, 才能以高維打低維, 快速破局.