【行業】AIGC-2023年有望成為AIGC的拐點(19頁)

AIGC(AI-Generated Content)是利用人工智能技術來生成內容。2021 年之前,AIGC生成的主要還是文字,而新一代模型可以處理的格式內容包括:文字、語音、代碼、圖像、視頻、機器人動作等等。AIGC 被認為是繼專業生產內容(PGC,professional-generatedcontent)、用戶生產內容(UGC,User-generated content)之后的新型內容創作方式,可以在創意、表現力、迭代、傳播、個性化等方面,充分發揮技術優勢。但是 GAN 有三個不足:1)對輸出結果的控制力較弱,容易產生隨機圖像;2)生成的圖像分別率較低;3)由于 GAN 需要用判別器來判斷生產的圖像是否與其他圖像屬于同一類別,這就導致生成的圖像是對現有作品的模仿,而非創新。因此依托 GAN 模型難以創作出新圖像,也不能通過文字提示生成新圖像。CLIP 模型能夠將文字和圖像進行關聯,比如將文字“狗”和狗的圖像進行關聯,并且關聯的特征非常豐富。因此,CLIP 模型具備兩個優勢:1)同時進行自然語言理解和計算機視覺分析,實現圖像和文本匹配。2)為了有足夠多標記好的“文本-圖像”進行訓練,CLIP模型廣泛利用互聯網上的圖片,這些圖片一般都帶有各種文本描述,成為 CLIP 天然的訓練樣本。據騰訊科技公眾號顯示,CLIP 模型搜集了網絡上超過 40 億個“文本-圖像”訓練數據,這為后續 AIGC 尤其是輸入文本生成圖像/視頻應用的落地奠定了基礎。

分享到: