ChatGPT 是由 OpenAI 公司在 2022 年 11 月 30 日發布的一種聊天機器人模型,是由人工智能技術驅動的自然語言處理工具。它使用了 Transformer 架構并訓練了大量的文本數據,能夠進行語言翻譯、問答、對話等任務。由于其在各種對話交互處理中的性能表現出色,自上線之后就迅速走紅,僅一周就吸引了超過百萬用戶,Elon Musk 也在推特盛贊 ChatGPT 的出色表現。AI 發展方興未艾,ChatGPT 的優秀表現也離不開強大的模型算法支撐。ChatGPT 采用了 RHLF(Reinforcement Learning from Human Feedback,基于人類反饋的強化學習)算法,采用人工標注的方式將NLP(Natural Language Processing,自然語言處理)和RL(Reinforced Learning強化學習)結合起來,極大地提升了模型效率和學習能力。
GPT 已經歷了三個版本的發展,ChatGPT 是 GPT-3 與 GPT-4 之間的過渡版本。GPT(Generative Pre-trained Transformer,生成式預訓練語言模型)系列模型是一種基于互聯網可用數據訓練的文本生成深度學習模型。GPT 模型是 OpenAI 公司研發的一系列模型,這一系列的模型可以在非常復雜的 NLP 任務中取得非常驚艷的效果,例如文章生成,代碼生成,機器翻譯,Q&A 等,而完成這些任務并不需要有監督學習進行模型微調。不過,要達到這樣的目的,GPT模型的訓練需要大量的數據、參數以及強大的算力支撐,GPT 模型的發展也印證了,通過不斷地提升模型容量和語料規模,模型的能力是可以不斷提升的。GPT 系列模型經歷了 GPT-1、GPT-2 和GPT-3 三個階段,ChatGPT 則是由 GPT-3 微調得到的一個聚焦于對話交互的過渡版本。
