【行業】計算機專題-ChatGPT:深度拆解(20頁)

OpenAI 產品發布密集,產品涵蓋音頻制作、圖像生成和語言對話人工智能。2016 年,推出用于開發和比較強化學習算法的工具包 OpenAI Gym,加速公開社會中 RL 研究進度。同時推出 Universe 軟件平臺,用于測試和訓練 AI 在全球游戲、網站和其他應用程序中的智能程度。2019 年,OpenAI 推出深度神經網絡 MuseNet,可以使用 4 種不同的樂器生成 10分鐘的音樂作品以及最終模型版本的 GPT-2。2020 年,研發團隊在 GPT-2 的基礎上拓展參數,發布了 GPT-3 語言模型。2021 年,發布了轉換器語言模型 DALL·E,從文本描述生成圖像。2022 年,OpenAI 在 GPT-3.5 的基礎上推出了 ChatGPT,強化了人工智能的語言對話能力,引起社會廣泛關注。OpenAI 當前盈利主要通過付費 API 接口,并嘗試拓展盈利模式。目前,OpenAI 提供 GPT-3、Codex 以及 DALL·E 的 API 數據接口,分別執行用戶自然語言任務、自然語言轉換為代碼的任務以及創建和編輯圖像的任務。API 接口根據類型不同以流量收費,比如圖像模型以分辨率分類按張數收費,語言模型則以基于的子模型型號按字符數收費。OpenAI API 盈利情況較好,據路透社數據,OpenAI 2022 年收入數千萬美元,公司預計 2023 與 2024 年收入分別為 2 億美元和 10 億美元。同時,OpenAI 正嘗試拓展自身盈利模式,2023 年 1 月試點推出訂閱制 ChatGPT Plus,收取每月 20 美元的會員費以得到各類優先服務。ChatGPT 采用監督學習+獎勵模型進行語言模型訓練。ChatGPT 使用來自人類反饋的強化學習 (RLHF) 來訓練該模型。首先使用監督微調訓練了一個初始模型:人類 AI 訓練員提供對話,他們在對話中扮演雙方——用戶和 AI 助手。其次,ChatGPT 讓標記者可以訪問模型編寫的建議,以幫助他們撰寫回復。最后,ChatGPT 將這個新的對話數據集與原有數據集混合,將其轉換為對話格式。

分享到: