首頁>消費 >
見證歷史!GPT-4發(fā)布:能玩梗能考律師!官網(wǎng)被擠爆 用戶直呼:強(qiáng)得離譜 2023-03-15 16:47:43  來源:21財經(jīng)

“見證歷史了?!笨吹紾PT4的發(fā)布后,有多位業(yè)內(nèi)人士感嘆道。

3月15日凌晨,OpenAI發(fā)布了多模態(tài)預(yù)訓(xùn)練大模型GPT-4,這也是其大型語言模型的最新版本。


【資料圖】

與此前的版本相比,GPT-4具備強(qiáng)大的識圖能力,文字輸入限制也提升至2.5萬字;GPT-4的回答準(zhǔn)確性也顯著提升,還能夠生成歌詞、創(chuàng)意文本從而實現(xiàn)風(fēng)格變化。同時,GPT-4在各類專業(yè)測試及學(xué)術(shù)基準(zhǔn)上也表現(xiàn)優(yōu)良。

“這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑。”O(jiān)penAI介紹,“GPT-4是一個大型多模態(tài)模型,它接受圖像和文本輸入、進(jìn)行文本輸出,雖然在許多現(xiàn)實場景中它尚且不如人類,但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出與人類相當(dāng)?shù)男阅堋?/strong>”

GPT-4震撼發(fā)布:會玩梗還能考律師

從整體而言,GPT-4實現(xiàn)了多重能力的躍升。

OpenAI介紹稱,在日常對話中,GPT-4與GPT-3.5之間的差距或許微妙,但當(dāng)任務(wù)復(fù)雜度足夠高的時候,GPT-4將具備更可靠、更具創(chuàng)造性的特點,且能夠處理更細(xì)致的指令。

例如,根據(jù)OpenAI公布的實驗數(shù)據(jù),GPT-4通過模擬律師考試且分?jǐn)?shù)在應(yīng)試者的10%左右。相較之下,GPT-3.5版本大模型的成績是倒數(shù)10%。

需要注意的是,相較于此前的GPT模型而言,GPT-4最大的突破之一是在文本之外還能夠處理圖像內(nèi)容。OpenAI表示,用戶同時輸入文本和圖像的情況下,它能夠生成自然語言和代碼等文本。

OpenAI用一張“梗圖”演示了GPT-4特有的多模態(tài)功能。在以下輸入圖片并設(shè)問“這些圖片有何可笑之處?請逐一描述?!盙PT-4便會在對每張圖片進(jìn)行表述后表示,“這幅圖的幽默之處在于,把一個大而過時的VGA接口插入一個小而現(xiàn)代的智能手機(jī)充電端口是荒謬的?!?/p>

除了普通圖片,GPT-4還能處理更復(fù)雜的圖像信息,包括表格、考試題目截圖、論文截圖、漫畫等。此外,在多語種方面,GPT-4也體現(xiàn)出優(yōu)越性。在測試的26種語言中,GPT-4在24種語言方面的表現(xiàn)均優(yōu)于GPT-3.5等其他大語言模型的英語語言性能,其中包括部分低資源語言如拉脫維亞語、威爾士語等。在中文語境中,GPT-4能夠達(dá)到80.1%的準(zhǔn)確性。

與此前的GPT模類似,GPT-4基礎(chǔ)模型可在訓(xùn)練完預(yù)測文檔中的單詞。在數(shù)據(jù)樣本方面,也同樣使用公開可用的數(shù)據(jù)及許可數(shù)據(jù)。為了提升基礎(chǔ)模型回應(yīng)與用戶之間意圖的匹配性,OpenAI同樣選擇了強(qiáng)化學(xué)習(xí)人類反饋(RLHF)來微調(diào)模型行為。

不過,OpenAI指出,在模型訓(xùn)練方面,GPT-4建立了可預(yù)測擴(kuò)展的深度學(xué)習(xí)棧。通過開發(fā)基礎(chǔ)設(shè)施及優(yōu)化,在多種規(guī)模下都可進(jìn)行預(yù)測。為驗證其可擴(kuò)展性,團(tuán)隊提前準(zhǔn)確預(yù)測了GPT-4在內(nèi)部代碼庫上的優(yōu)化指標(biāo),但使用的計算量僅為萬分之一。

盡管GPT-4功能強(qiáng)大,但同時OpenAI也坦言,與早期GPT模型類似,GPT-4也具備局限性。GPT-4依然會形成推理錯誤,因而在使用語言模型輸出時需要非常小心,最好以人工核查、附加上下文或避免高風(fēng)險使用的方式予以輔助。

“GPT4的模型發(fā)布,本身是技術(shù)持續(xù)升級迭代發(fā)展的必然階段。AI行業(yè)每一年都會有些新模型發(fā)布,趨勢就是大模型、多模態(tài)。”在接受21世紀(jì)經(jīng)濟(jì)報道記者采訪時,IDC中國研究總監(jiān)盧言霞表示,“多模態(tài)肯定是必然趨勢,畢竟AI要真正達(dá)到人的智慧,需要處理多模數(shù)據(jù)。且在各行業(yè)場景里,大都是涉及多模態(tài)數(shù)據(jù)的處理?!?/p>

OpenAI付款系統(tǒng)被擠爆

首批用戶連夜寫測評

目前,ChatGPT的Plus訂閱用戶已經(jīng)可以使用GPT-4,其他用戶需要排隊申請內(nèi)測。

據(jù)財聯(lián)社報道,當(dāng)天凌晨,在部分微信群,記者看到有不少用戶不眠不休測試GPT-4的表達(dá):或用來出營銷策劃、寫廣告詞;或用于解答邏輯題、數(shù)學(xué)題;甚至還有用來調(diào)侃腦筋急轉(zhuǎn)彎。GPT-4均對答入流,并展示出其強(qiáng)悍的處理能力,用戶直呼“強(qiáng)得離譜”、“牛啊”。

更有用戶連夜寫出了一份測評:

由于僅限于Plus訂閱用戶使用,當(dāng)晚,大批新訂用戶涌入,以至于OpenAI的付款系統(tǒng)被擠爆了。

已在必應(yīng)中應(yīng)用

從商業(yè)應(yīng)用角度而言,目前GPT-4沒有免費版本。

不過在GPT-4發(fā)布后,OpenAI也直接升級了ChatGPT,目前,GPT-4的訪問權(quán)限僅面向ChatGPT Plus的付費訂閱用戶及企業(yè)和開發(fā)者開放。

想要訪問GPT-4的API,用戶可以注冊等待,OpenAI將邀請部分開發(fā)者進(jìn)行體驗。

此外,在GPT-4發(fā)布后,微軟方面則宣布,目前全新必應(yīng)預(yù)覽版中已經(jīng)搭載了定制版本的GPT-4。

“如果您在過去五周內(nèi)的任何時間使用過新的必應(yīng)預(yù)覽版,那么您已經(jīng)體驗過這個強(qiáng)大模型的早期版本?!蔽④洷硎荆半S著OpenAI對GPT-4及更高版本進(jìn)行更新,必應(yīng)將從這些改進(jìn)中受益?!?/p>

事實上,GPT-4的應(yīng)用空間還是頗具想象的。目前,微軟已經(jīng)將 ChatGPT整合進(jìn)云平臺Azure Open AI 中,企業(yè)和個人開發(fā)者均可借助Azure

Open AI功能直接集成到應(yīng)用產(chǎn)品中,通過私人定制ChatGPT來提供個性化客戶服務(wù),建立企業(yè)級智能化知識庫搜索引擎等。

“微軟有望在產(chǎn)業(yè)中通過GPT-4不斷拓展下游新興領(lǐng)域,應(yīng)用于更多的場景中,并利用其多模態(tài)模型成本改變傳統(tǒng)AI客制化與定制化的特點,逐步向通用化方向發(fā)展?!比A鑫證券計算機(jī)研究團(tuán)隊分析稱。

浙江大學(xué)國際聯(lián)合商學(xué)院數(shù)字經(jīng)濟(jì)與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤和林在接受21世紀(jì)經(jīng)濟(jì)報道記者采訪時評論稱,GPT-4的核心能力提升體現(xiàn)為基本智能水平提升、多模態(tài)模型方面,后者意味著對文字互動形式的突破,識別能力擴(kuò)展至圖片領(lǐng)域。

在商業(yè)落地方面,盤和林指出,GPT-4一經(jīng)發(fā)布,支付渠道就出現(xiàn)了擁堵,用戶熱情是足夠的,“這也就意味著當(dāng)前OpenAI實際上沒有商用落地的憂慮,這款產(chǎn)品已經(jīng)可以實現(xiàn)變現(xiàn)?!?/strong>

此前有業(yè)內(nèi)觀點認(rèn)為,GPT-4的發(fā)布有望成為生成式AI向超級AI快速演變的關(guān)鍵節(jié)點,而此次GPT-4真正亮相后,也引爆了業(yè)內(nèi)討論。

“GPT-4和GPT-3的主要區(qū)別在于模型的規(guī)模和能力,其多模態(tài)的模型超出文本范圍實現(xiàn)了對圖像乃至視頻的AI生成,同時突破生成文本的語種限制,實現(xiàn)多語種語言數(shù)據(jù)的輸入輸出?!比A鑫證券計算機(jī)研究團(tuán)隊表示,“這是一場偉大的變革,AI可干的事越來越多,也許未來它將成為人類得心應(yīng)手的工具?!?/p>

(文章來源:21財經(jīng))

關(guān)鍵詞:

相關(guān)閱讀:
熱點
圖片 圖片