3月15日凌晨,OpenAI發(fā)布了多模態(tài)大模型GPT-4,并迅速引爆全球輿論。GPT-4的前代產(chǎn)品,正是訓(xùn)練出上線兩個(gè)月狂吸1億粉的ChatGPT大模型GPT3.5。而GPT-4不僅較GPT3.5全方位升級(jí),還開(kāi)放了對(duì)圖片的處理能力,瞬間引發(fā)了全球用戶對(duì)于未來(lái)工作方式的暢想以及對(duì)于人與科技關(guān)系的新一輪思考。
與全球用戶同樣坐不住的,是微軟和谷歌,前者積極跟進(jìn),后者立刻反擊。GPT-4引發(fā)的AI風(fēng)暴,才剛剛開(kāi)始。
將前代產(chǎn)品“拍在沙灘上”
相比前代產(chǎn)品,GPT-4不僅支持多模態(tài),還從多個(gè)維度提升了自然語(yǔ)言文本處理能力,并進(jìn)一步提升了安全性。
與前代產(chǎn)品著重處理文字輸入不同,GPT-4能夠處理圖片信息以及帶有文本和照片的文檔、圖表或屏幕截圖等圖文交錯(cuò)的信息,并以文字的方式輸出。比如輸入一張氫氣球被細(xì)線系著的照片,并向GPT-4提問(wèn)“如果線被切斷會(huì)怎樣”,GPT-4的回答是“線斷了氣球會(huì)飛走”,這表明它不僅能識(shí)別照片中的各項(xiàng)事物,還能夠理解事物之間的關(guān)系。
用戶問(wèn)圖中的線斷了會(huì)怎樣,GPT-4回答“氣球會(huì)飛走”
在自然語(yǔ)言文本理解和生成這項(xiàng)看家本領(lǐng)上,GPT-4相較GPT3.5有著多方面的提升。
首先,GPT-4能夠識(shí)別和處理更復(fù)雜的指令。比如OpenAI的工作人員在demo展示中設(shè)置了一個(gè)“文本摘要”任務(wù),要求GPT將一段話總結(jié)為一句話,且句子中的每一個(gè)詞都要以“G”開(kāi)頭。在測(cè)試中,GPT-3.5直接忽視了以固定字母開(kāi)頭的要求,僅僅將文章總結(jié)成一段話。GPT-4則生成了基本符合要求的回答,但是在句子中出現(xiàn)了“AI”一詞。隨后工作人員在對(duì)話中表示“AI不算G開(kāi)頭字母”,GPT-4馬上將“AI”換成了“global”。
藍(lán)框內(nèi)為GPT-4生成的每個(gè)單詞都以“G”開(kāi)頭的一句話摘要
其次,GPT-4比GPT3.5更能應(yīng)對(duì)復(fù)雜微妙的場(chǎng)景。比如在一次模擬律師考試中,GPT-4 的分?jǐn)?shù)在應(yīng)試者中排名前 10%,而GPT-3.5 的得分排名在后10%。說(shuō)明GPT-4在專(zhuān)業(yè)測(cè)試中的表現(xiàn)更接近人類(lèi)水平。
此外,GPT-4能夠讀取、分析或產(chǎn)生的文字篇幅高達(dá)25000詞,遠(yuǎn)超篇幅上限為3000詞的ChatGPT,可用于長(zhǎng)篇內(nèi)容創(chuàng)作、擴(kuò)展對(duì)話以及文檔搜索和分析等應(yīng)用場(chǎng)景。
ChatGPT與GPT-4能處理的篇幅對(duì)比
在備受關(guān)注的安全方面,GPT-4響應(yīng)被禁止內(nèi)容請(qǐng)求的可能性降低了82%,產(chǎn)生事實(shí)響應(yīng)的可能性提升了40%。
進(jìn)一步融入微軟搜索和云服務(wù)
在GPT-4發(fā)布后,微軟第一時(shí)間“認(rèn)領(lǐng)”, 表示新版的搜索引擎必應(yīng)已經(jīng)在 GPT-4 上運(yùn)行。另?yè)?jù)OpenAI披露,GPT-4在微軟Azure AI 超級(jí)計(jì)算機(jī)上進(jìn)行訓(xùn)練,并將基于Azure 的AI基礎(chǔ)架構(gòu)向世界各地的用戶提供 GPT-4能力。這個(gè)超級(jí)計(jì)算機(jī)是OpenAI與Azure為OpenAI的深度學(xué)習(xí)架構(gòu)重新設(shè)計(jì)的。
微軟與OpenAI的合作始于2019年,今年1月,微軟宣布與OpenAI的合作進(jìn)入第三階段,將圍繞大規(guī)模超級(jí)計(jì)算機(jī)、新的AI體驗(yàn)、獨(dú)家云供應(yīng)商開(kāi)展。通過(guò)超級(jí)計(jì)算機(jī)支持OpenAI的研究正是雙方合作計(jì)劃的一部分。
微軟對(duì)OpenAI的布局方向,也可以從雙方的合作承諾中看出端倪。接下來(lái),微軟會(huì)在消費(fèi)者和企業(yè)級(jí)產(chǎn)品中部署 OpenAI 模型,并引入基于 OpenAI 技術(shù)的新型數(shù)字體驗(yàn)。其中,Azure OpenAI 服務(wù)使開(kāi)發(fā)人員能夠直接接入OpenAI模型,并獲得Azure在可信執(zhí)行環(huán)境、企業(yè)級(jí)功能、AI 優(yōu)化的基礎(chǔ)設(shè)施和工具等方面的支持,以開(kāi)發(fā)尖端的AI應(yīng)用。作為 OpenAI 的獨(dú)家云提供商,Azure 將為研究、產(chǎn)品和 API 服務(wù)中所有 OpenAI 工作負(fù)載提供支持。
不甘示弱的谷歌
在GPT-4發(fā)布后,谷歌立刻發(fā)動(dòng)反擊,宣布開(kāi)放大規(guī)模語(yǔ)言模型PaLM的API接口,并推出面向開(kāi)發(fā)者的工具M(jìn)akerSuite。PaLM API 是谷歌大型語(yǔ)言模型的入口,可用于各種應(yīng)用程序的開(kāi)發(fā)。開(kāi)發(fā)者可以通過(guò)API訪問(wèn)面向內(nèi)容生成和聊天進(jìn)行優(yōu)化的模型,以及面向摘要、分類(lèi)等用例進(jìn)行優(yōu)化的通用模型。隨之推出的工具M(jìn)akerSuite能夠讓開(kāi)發(fā)人員更加快捷地制作程序原型。
也是在今天,谷歌發(fā)布博文,宣布將生成式AI能力——包括文字、圖像、代碼、音頻、視頻等內(nèi)容的生成能力提供給開(kāi)發(fā)者、行業(yè)和政府。
這已經(jīng)不是谷歌針對(duì)GPT的第一次反擊。今年2月,谷歌發(fā)布了對(duì)標(biāo)ChatGPT的聊天機(jī)器人Bard,其背后的大模型是谷歌2020年發(fā)布的大規(guī)模語(yǔ)言模型LaMDA。LaMDA與GPT模型一樣建立在Transformer架構(gòu)上,但接受的是對(duì)話訓(xùn)練,尤其是不以“是”或“否”回答的開(kāi)放式對(duì)話。其目的在于通過(guò)對(duì)比不同問(wèn)題、不同回答中的細(xì)微差別,使LaMDA能夠針對(duì)各種話題生成明確具體的回答。
目前,谷歌旗下有Bert、MUM、PaLM、Imagen 和MusicLM等多款大模型,GPT等多款大規(guī)模語(yǔ)言模型采用的Transformer架構(gòu)也由谷歌在2017年發(fā)布。其中,Bert是谷歌第一代基于Transformer研發(fā)的大規(guī)模語(yǔ)言模型,由此開(kāi)啟了全球科技巨頭圍繞大規(guī)模語(yǔ)言模型的軍備競(jìng)賽。而2022年推出的PaLM參數(shù)量高達(dá)5400億。谷歌在大模型領(lǐng)域有著長(zhǎng)期的技術(shù)積累。
與微軟類(lèi)似,谷歌對(duì)于AICG和大規(guī)模語(yǔ)言模型的布局,圍繞兩條線進(jìn)行,一是以搜索引擎為代表的消費(fèi)端,二是以云服務(wù)為代表的企業(yè)端。從Bert開(kāi)始,谷歌就在搜索引擎中引入了大模型,以提升用戶檢索信息并將信息轉(zhuǎn)化為知識(shí)的效率。今日,谷歌還表示會(huì)在谷歌云上部署Vertex AI等開(kāi)發(fā)平臺(tái)和開(kāi)發(fā)環(huán)境,讓開(kāi)發(fā)者能夠利用AICG能力,開(kāi)發(fā)符合企業(yè)級(jí)安全和隱私保護(hù)要求的產(chǎn)品。
仍有局限性
雖然GPT-4的能力較前代產(chǎn)品有了顯著的提升,但仍然存在一些局限性。
首先是可靠性不足。比如,對(duì)于不了解的事物,GPT模型有可能生成虛構(gòu)或錯(cuò)誤的答案,產(chǎn)生人工智能式“幻覺(jué)”。
由于大部分預(yù)訓(xùn)練數(shù)據(jù)截止到2021年9月,GPT-4對(duì)之后發(fā)生的事件缺乏了解,也沒(méi)有從中吸取經(jīng)驗(yàn)。它有時(shí)會(huì)犯一些簡(jiǎn)單的推理錯(cuò)誤,或者在接受用戶錯(cuò)誤的陳述時(shí)表現(xiàn)得過(guò)于輕信。
此外,GPT-4 也可能在預(yù)測(cè)中犯錯(cuò),在可能出錯(cuò)時(shí)不注意仔細(xì)檢查工作。GPT-4在輸出中也存在偏差,OpenAI表示已經(jīng)對(duì)偏差進(jìn)行了糾正,但仍需要時(shí)間解決。
但最令產(chǎn)業(yè)界和廣大用戶關(guān)注的,是GPT-4以及大模型的倫理安全問(wèn)題。對(duì)此,OpenAI表示,GPT-4和后續(xù)模型有可能以有益和有害的方式對(duì)社會(huì)產(chǎn)生影響。該團(tuán)隊(duì)正在與外部研究人員合作,以改善其理解和評(píng)估GPT-4潛在影響的方式,建立對(duì)未來(lái)系統(tǒng)中可能出現(xiàn)的危險(xiǎn)能力的評(píng)估機(jī)制。短期內(nèi),OpenAI將公布關(guān)于社會(huì)為應(yīng)對(duì)人工智能影響可以采取的措施的建議,以及預(yù)測(cè)人工智能可能產(chǎn)生的經(jīng)濟(jì)影響。
- QQ:61149512