【行業】計算機深度研究-GPU制霸AI數據中心市場(24頁)

GPU(Graphics Processing Unit)是圖形處理單元。是個人電腦、工作站以及移動設備等用來進行圖像處理的微處理器。顯卡是連接計算機主板和顯示器的重要元件,可以接受主板的控制信號,轉換成顯示器能夠識別的命令,控制顯示器正確顯示圖像信息。而GPU 就是顯卡的處理器,是顯卡的“大腦”,專門用來處理圖形計算任務。

GPU 架構特點。GPU 架構特點與其需要處理的任務相關,其處理和顯示的計算機圖形本質上都是二維數據矩陣。計算機圖形顯示的基本單元是像素點,眾多像素點構成各種線段、平面和形狀,通常我們說的320*215 的顯示屏是指像素點行數是320個,列數是215 個,構成一個320*215 的矩陣,布滿整個屏幕。由于圖像信息都是以這種矩陣像素點形式存儲和呈現的,因此處理圖片的GPU 需要以矩陣形式存在的基本處理單元,來分塊處理這些矩陣數據。

GPU 與CPU 區別。從GPU 與CPU 架構對比圖可以看出,CPU 的邏輯運算單元(ALU)較少,控制器(control)占比較大;GPU 的邏輯運算單元(ALU)小而多,控制器功能簡單,緩存(cache)也較少。GPU 的眾多邏輯運算單元呈矩陣排列,可以并行處理數量眾多但較為簡單的處理任務,圖像運算處理就可以進行這樣的拆解。GPU 單個運算單元處理(ALU)能力弱于CPU,但是數量眾多的運算單元可以同時工作,當面對高強度并行計算時,其性能要優于CPU。

以英偉達Maxwell 架構的GM200 處理器說明GPU 的內部結構。該處理器由4 個圖形處理集群(GPC)和16 個流處理集群(SMM)組成。每個流處理集群又由4個調度器組成,每個調度器控制著32 個邏輯計算內核(core),這些計算內核就是實現邏輯運算的基本單元。相對于CPU 的“多核”,GPU 算得上是“眾核”。

GPU 處理流程。在電腦中,GPU 被集成在顯卡中進行圖形處理。整個計算機運行時,CPU 將圖形處理任務交給GPU 進行處理。GPU 從CPU 獲得指令后,把大規模、無結構化的圖像數據分解成許多獨立的塊,分配給各個流處理集群(SMM)。每個流處理集群再次把數據分解,分配給調度器,調度器將任務放入自身所控制的32個計算內核(core)中完成最終的數據處理任務。如果將一個core 的運算過程記為一個線程,那么該顯卡就有32*4*16=2048 個線程同時進行。而當前英特爾最強大的酷睿X 系列處理器頂配也只能做到18 核、36 線程。這些任務單一、數量眾多同時進行的線程可以大大縮短計算機運算時間,這即是GPU 在圖形處理方面的優勢所在。

分享到: