AI 2.0時代來臨,語音AI成為新入口。近日,國外媒體報道蘋果或將于WWDC 推出智能音箱產品,引發語音人工智能領域關注。一方面,以亞馬遜Echo 智能音箱為代表的現象級AI 產品廣泛應用于日常家居生活;另一方面,中國2017 年兩會政府工作報告首提人工智能,“科技創新2030—重大項目”關注人工智能2.0 主題,AI 全面升級為國家層面發展戰略。由于學習驅動方式、數據處理方式、計算形態、平臺生成方式和研究理念五大方面的變化,政策和產業的現狀表明AI 2.0 時代已經來臨。我們認為,智能終端設備的普及使得語音在人機交互、信息獲取等方面的入口特性完全體現。我們圍繞“語音識別—語義理解—決策反饋”流程提出“語音AI”概念,并認為其日漸成為AI 2.0 產業生態的核心,具備AI 2.0 時代的入口地位。
支撐技術日趨成熟,夯實產品服務創新基礎。語音AI 技術主要包括算法、計算能力和數據三個要素。根據上述語音AI 作業流程展開分析,算法的支撐技術主要包含語音識別、聲紋識別、自然語言處理和用于優化算法性能的深度學習等技術;計算能力主要依賴GPU、FPGA 等芯片和麥克風陣列等硬件;數據方面則需和應用場景相結合。我們認為,近年來各項關鍵技術均取得重要突破,使得語音AI 技術基礎日趨成熟,產品化進程加快,產品與服務創新日益滿足用戶需求。
科技公司積極布局,以期搶占入口形成壁壘。工信部預測2017 年全球智能語音產業規模可達112.4 億美元,未來五年復合年均增長率可超30%。眾多知名科技公司已經開始加大該領域的投入。我們將語音AI產業鏈分為上游的基礎技術層、中游的基礎應用層和下游的方案產品集成層。基礎技術層企業主要關注語音支撐技術的研發與優化,基礎應用層企業主要解決技術在應用場景的適用問題,而產品集成層企業主要實現具體產品形態和運營工作等。我們分析了產業鏈上的主要參與者的技術與產品布局,包括谷歌、亞馬遜、微軟、蘋果、BAT 等科技廠商,以及科大訊飛、Nuance 等語音垂直領域廠商。我們認為科技龍頭企業采取“自身發力+產業結合”的戰略,有助于通過語音入口搶占AI 時代先機,形成競爭壁壘。