近日,快手自研大模型產品“可圖”(Kolors)正式對外開放,支持文生圖和圖生圖兩類功能,已上線20余種AI圖像玩法。目前,用戶可以通過“可圖大模型”官方網站和微信小程序,免費使用各項AI圖像功能。
(“可圖大模型”微信小程序)
從具體功能上看,一方面,可圖提供AI形象定制功能,即圖生圖功能,通過人像保持技術,可輕松保留人像的自然特征,并一鍵生成各種風格的人像作品,滿足不同社交及營銷場景的個性化形象需求。例如,用戶只需上傳一張面部輪廓清晰的照片,并選擇偏好的風格,調節(jié)保留面部特征的程度,便可創(chuàng)作出既有個性又富含藝術感的頭像。
目前,可圖已上線10余種AI形象定制風格玩法。在六一兒童節(jié)來臨之際,可圖還特別推出了QQ秀風格的“紅鉆貴族”和“我的小時候”兩種玩法,支持用戶上傳圖片生成復古像素風格化圖片和童年寫真,打造個人二次元IP形象,回味美好的童年時光。
(可圖“紅鉆貴族”風格玩法)
(可圖“我的小時候”風格玩法)
此外,可圖還提供粘土世界、炫彩琉璃、夢幻莫奈、甜蜜情人節(jié)、春日卡通、水彩浪漫等風格化玩法,以及韓式寫真、魔法學院、帥氣賽車、浪漫海島等寫實風玩法,打造專屬的個性化寫真。
(可圖寫實人像玩法)
另一方面,快手可圖大模型也提供AI創(chuàng)作功能,即文生圖,支持用戶自由輸入文本,生成風格多樣、畫質精美、創(chuàng)意十足的繪畫作品。同時用戶也可以上傳參考圖,可圖將根據(jù)參考圖像的風格、主題和細節(jié)等內容,生成既符合創(chuàng)意描述又與參考圖相關的圖像作品。
例如,根據(jù)“油畫,被鮮花簇擁的貓咪,布偶,浮雕質地,多層次維度,栩栩如生,粉色氛圍感”等文字描述,可圖生成了質感十足、細節(jié)生動的貓咪油畫。不僅動物畫極具創(chuàng)意,在人物畫方面,可圖同樣功能強大,基于“男孩,天真可愛,水汪汪的大眼睛,背面,轉頭微笑,高清,亞麻色卷發(fā),小斗篷”等描述生成的超寫實作品,細節(jié)刻畫精美,人物形神兼?zhèn)洹?/p>
不僅是油畫,國畫、動漫等多樣風格的繪畫作品,可圖均可一一呈現(xiàn)。在可圖輸入文本“荷塘,水墨畫,留白,意境,齊白石風格,細膩的筆觸,宣紙的紋理”,一幅荷塘圖即刻生成。根據(jù)“戴草帽的男人,肩上站著一只鸚鵡,極簡,波西米亞風格”等描述,可圖同樣生成了高質量的精美AI圖片。
值得注意的是,“可圖”大大降低了AI圖像生成的使用門檻,提供了更好的使用體驗:與同類產品需多張照片和較長時間來完成AI生成不同不同,可圖只需一張圖片和幾秒鐘時間,便可生成一套效果優(yōu)秀的AI圖像。
在強大的功能背后,快手大模型團隊的技術能力為產品提供了有力支撐。例如,在中文特色理解方面,可圖基于快手自研的知識圖譜構建了上億級別的中文特色圖文數(shù)據(jù),結合中文大語言模型的文本表征能力,能夠精準描繪和表達各類中文場景。
據(jù)悉“可圖”大模型的參數(shù)規(guī)模達十億級,這些數(shù)據(jù)來自于開源社區(qū)、快手內部構建和自研AI技術合成,覆蓋了常見的千萬級中文實體概念,還引入強化學習和獎勵模型技術(RLHF),解決了文生圖大模型在長文本和復雜語義文本輸入下的效果問題。
同時,在畫質提升方面,可圖模型通過優(yōu)化擴散模型的加噪去噪理論,以實現(xiàn)對高質量、細節(jié)豐富的圖像生成的訓練和推理的精準適配,同時引入了經過優(yōu)質專家標注的圖文數(shù)據(jù)集,以對齊人類審美偏好,提升模型性能表現(xiàn)。
據(jù)媒體報道,去年9月,“可圖”大模型平臺已在快手開啟內測,快手在App評論區(qū)推出的“AI玩評”和“AI小快”等多種創(chuàng)新互動玩法,集合了文生圖、圖生圖、擴圖等功能,也是基于可圖大模型能力。
近日,在2024年一季度財報電話會上,快手CEO程一笑介紹,今年一季度,快手穩(wěn)步推進自研大模型各項性能的迭代提升,并且加快大模型在各業(yè)務場景的應用。隨著大模型產品可圖的正式發(fā)布,快手也將持續(xù)為用戶帶來更豐富有趣的AI互動新體驗。
- QQ:61149512