數據量呈現指數級增長,企業端占比不斷提升。根據中國信通院,到 2035 年,全球數據量將達 2142ZB(ZB:Zettabyte,1ZB 約十萬億億字節),是 2020年所創建數據量的 45-46 倍。而由于進入云時代,數據在本地存儲的需求逐步減少,企業在云端可為客戶提供實時的數據和服務。
數據逐漸成為經濟發展的重要生產要素。基于云能夠快速訪問的數據運用方式,數據日益影響企業和日常生活,例如商業航空旅行、自動駕駛、醫療應用、控制系統和遙測技術等社會生產力緊密相關的數據占比持續提升。IDC 預計到 2025年,娛樂相關的消費型數據占比將從 2012 年接近 60%下降至 30%左右,余下約 70%將是非娛樂化的圖像/視頻、生產力數據、工業生產等嵌入式數據。
單個數據的價值下降,多維數據整合方可挖掘深度價值,進一步催生算力需求。當前數據指數級增長的同時,數據類型也更加多元化,在交通、工業、商業運營等領域,少量、單一化的數據的價值較低,只有將大量、多維度的數據進行綜合分析才能產生應有的價值。例如交管領域對于黑車的識別,需要將車輛行駛軌跡、車輛圖像識別、人像識別與對比、車牌登記數據比對等多維度數據進行分析才能準確篩選。對于龐雜的不同類型數據(尤其非結構化的)統一分析與存儲的需求催生了數據湖概念,同時隨著云計算技術的深入應用,帶來資源集約化和應用靈活性優勢的云原生概念也產生,大規模集群計算需求旺盛。