AI 音箱的智能性:語音交互+連接。智能音箱是傳統音箱的升級產物,不再僅僅局限于播放聲音,而是增加了智能化功能,這種智能化的功能主要體現在語音交互+連接。語音交互:使智能音箱可快速識別用戶需求并提供服務,通過聯網也能進一步分析和優化用戶的交互指令。連接:提供海量流媒體內容,提供多種互聯網服務,通過語音指令對智能家居進行控制。
AI 音箱領導者: 2014 年亞馬遜發布全球首款智能音箱 Echo,并于 2015 年正式發售,發售首年銷量即達 240 萬臺,16 年銷量 520 萬臺超越 Sonos 成為行業霸主。亞馬遜的內載語音操作系統是 Alexa,其技能數增勢明顯,至今已有超過 4.5 萬的技能。除了技能數之外,亞馬遜 Echo 系列的產品種類也很多:從首發 179.99 美元的 Echo,到后來的定位為場景延伸的 Echo Dot 和控制中心的帶屏音箱 Echo Show 等。不斷擴充的產品種類和龐大的技能數量是亞馬遜成為行業領導者重要的因素。
語音交互的崛起為智能音箱的可能提供基礎。盡管通過鍵盤鼠標的 PC 端人機交互和觸屏操作的移動端交互仍是目前主要的人機交互方式,但語音交互方式正逐漸成為主流。據艾瑞咨詢調查,2018 年,國內 33.3%的用戶每天都會用智能語音助手。智能語音助手使用頻率和普及率的增加,說明用戶對語音交互的需求正逐步增大。背后原因是:1).語音交互是人類最原始的交互方式。2).語音交互是最便捷最快速的交互方式 3).語音識別技術達到人們的接受范圍,使語音交互成為可能。
智能語音操作系統是語音交互主要承載基礎。語音操作系統包含海量技能,大部分的智能語音操作系統都開放了 SDK,龐大的開發者數量凸顯了智能音箱的個性化定制,豐富了智能音箱的功能。
語音交互技術中難度相對較大的是語音識別,而語音識別技術有六個主要的技術難點:語音激活檢測 VAD、語音喚醒 VT、回聲消除、低信噪比、混響和雞尾酒會問題。其中每個技術難點目前都并未完全攻克,即便是提出了解決方法,也還存在可以提升效果的空間。智能音箱因為其天然的語音特性,生產廠商在解決語音識別技術方面已經有了技術積累,而且類似于低信噪比和混響等問題的解決還依靠設備本身的體積參數,因此智能音箱在語音識別技術、硬件方面比其他智能家居產品更具優勢。