AI芯片:基于矩陣運算、面向AI應用的芯片設計方案。1、定義:當前AI芯片設計方案繁多,包括但不限于GPU\FPGA\ASIC\DSP等。目前市場上的對于AI芯片并無明確統一的定義,廣義上所有面向人工智能(Artificial Intelligence,AI)應用的芯片都可以被稱為AI芯片。2、當前AI運算指以“深度學習” 為代表的神經網絡算法,需要系統能夠高效處理大量非結構化數據(文本、視頻、圖像、語音等)。這需要硬件具有高效的線性代數運算能力,計算任務具有:單位計算任務簡單,邏輯控制難度要求低,但并行運算量大、參數多的特點。對于芯片的多核并行運算、片上存儲、帶寬、低延時的訪存等提出了較高的需求。3、針對不同應用場景,AI芯片還應滿足:對主流AI算法框架兼容、可編程、可拓展、低功耗、體積及造價等需求。
AI芯片滿足AI應用所需的“暴力計算”需求。早在上世紀80年代,學術界已經提出了相當完善的人工智能算法模型,但直到近些年,模型的內在價值也沒有被真正的實現過。這主要是受限于硬件技術發展水平,難以提供可以支撐深度神經網絡訓練/推斷過程所需要的算力。直到近年來GPU\FPGA\ASIC等異構計算芯片被投入應用到AI應用相關領域,解決了算力不足的問題。下圖以云計算場景為例,通過對全球幾大科技巨頭的代表性云端芯片產品計算性能對比,我們可以發現ASIC芯片相比起其他幾種芯片,在計算效能、大小、成本等方面都有著極大優勢,未來隨著通用AI指令集架構的開發,預計會出現最優配置的AI計算芯片。
AI芯片對CPU并非替代,與CPU共同滿足新時代計算需求。目前來看,AI芯片并不能取代CPU的位置,正如GPU作為專用圖像處理器與CPU的共生關系,AI芯片將會作為CPU的AI運算協處理器,專門處理AI應用所需要的大并行矩陣計算需求,而CPU作為核心邏輯處理器,統一進行任務調度。在服務器產品中,AI芯片被設計成計算板卡,通過主板上的PCIE接口與CPU相連;而在終端設備中,由于面積、功耗成本等條件限制,AI芯片需要以IP形式被整合進SoC系統級芯片,主要實現終端對計算力要求較低的AI推斷任務。