GPT-3模型目前已入選了《麻省理工科技評論》2021年“十大突破性技術。 GPT-3的模型使用的最大數據集在處理前容量達到了45TB。根據 OpenAI的算力統計單位petaflops/s-days,訓練AlphaGoZero需要1800-2000pfs-day,而GPT-3用了3640pfs-day。
AI運算指以“深度學習” 為代表的神經網絡算法,需要系統能夠高效處理大量非結構化數據(文本、視頻、圖像、語音等)。需要硬件具有高效的線性代數運算能力,計算任務具有:單位計算任務簡單,邏輯控制難度要求低,但并行運算量大、參數多的特點。對于芯片的多核并行運算、片上存儲、帶寬、低延時的訪存等提出了較高的需求。
根據機器學習算法步驟,可分為訓練(training)芯片和推斷(inference)芯片。訓練芯片主要是指通過大量的數據輸入,構建復雜的深度神經網絡模型的一種AI芯片,運算能力較強。推斷芯片主要是指利用訓練出來的模型加載數據,計算“推理”出各種結論的一種AI芯片,側重考慮單位能耗算力、時延、成本等性能。