首頁>資訊 >
世界觀天下!說自己“?!痢?,GPT-4真不是王婆賣瓜 2023-03-15 20:54:50  來源:36氪

扔給聊天機(jī)器人一張圖表,它不但能看懂,還能給你如此這般做一番運算,發(fā)來一段對圖表的解讀。

你不服氣,又扔過去一張無厘頭的梗圖,它不但能看懂這張圖里有車有人,還能告訴你之所以好笑是因為“這個男人在出租車上面熨衣服”。


(資料圖)

這不是暢想,而是OpenAI最新發(fā)布的大型多模態(tài)GPT-4已經(jīng)具備的能力。北京時間3月15日凌晨,OpenAI正式發(fā)布了該模型。

簡單來說,GPT-4與前代相比可以接受的文本輸入上限更高,回答的準(zhǔn)確性提高,能夠生成歌詞、創(chuàng)意文本等多樣化風(fēng)格的內(nèi)容。最最最令人振奮的是,GPT-4有強大的識圖能力,可以解讀圖片。

過去ChatGPT能做到的,新模型做得更好了;ChatGPT做不到的,新模型也可以做到了。

開通了ChatGPT Plus的付費用戶已經(jīng)可以選擇GPT-4模型,其他用戶則可以加入候補名單等待。但目前Plus用戶只能使用文本輸入,讀圖的功能尚未全面開放。

外界用極大的熱情迎接了GPT-4。在消息公布之后,OpenAI官網(wǎng)一度發(fā)生擁堵,很多用戶在社交媒體表示這下秒開了Plus服務(wù)?!癎PT-4”登上推特美國、日本等地區(qū)熱榜,也登上了國內(nèi)的微博熱搜榜、抖音熱榜社會榜等。

顛覆ChatGPT的,果然還是OpenAI自己。

A

GPT-4究竟有多厲害?

在官方演示視頻中,OpenAI總裁兼聯(lián)合創(chuàng)始人格雷格·布羅克曼(Greg Brockman)用筆和紙畫了個網(wǎng)站展示給GPT-4,后者僅用1到2秒的時間,就生成了網(wǎng)頁代碼、制作出了幾乎與圖中一模一樣的網(wǎng)站。

GPT-4可接受的文字輸入長度提升到了2.5萬個單詞,允許長內(nèi)容創(chuàng)建、擴(kuò)展對話以及文檔搜索和分析等。在高級推理能力上,GPT-4也有提升。它可以更準(zhǔn)確地解決難題,具有更廣泛的常識和解決問題的能力。

OpenAI表示,GPT-4在專業(yè)和學(xué)術(shù)方面表現(xiàn)出接近于人類的水平。其給出的例子稱,在模擬律師考試中,GPT-4的得分能排進(jìn)前10%左右,而GPT-3.5的得分只能排在倒數(shù)10%左右。

而且GPT-4不僅是能對文本或圖片進(jìn)行單獨的識別,而是可以接受圖文混排的內(nèi)容。

“請記住,GPT-4不僅僅是一個語言模型,它還是視覺模型。實際上,它可以靈活地接受如文檔中那樣任意散布的圖像和文本?!毖菔疽曨l中出現(xiàn)包含各種圖片和文字的電腦屏幕截圖時,格雷格如是強調(diào)。

在OpenAI官方介紹顯示,GPT-4可以對插入了多個圖表的論文進(jìn)行解讀,并用精煉的語言總結(jié)論文的內(nèi)容。

OpenAI表示,公司花了6個月的時間,利用ChatGPT的經(jīng)驗教訓(xùn)以及對抗性測試調(diào)整GPT-4,使其在真實性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來最好的結(jié)果。

“至少對我們來說,GPT-4訓(xùn)練運行前所未有的穩(wěn)定,成為首個能夠提前準(zhǔn)確預(yù)測其訓(xùn)練性能的大型模型?!?/p>

但OpenAI也表示,GPT-4并非完美,仍然不能完全摒除人工智能的“幻覺”,而且訓(xùn)練數(shù)據(jù)的時間依舊停留在2021年9月,可能會出現(xiàn)推理錯誤:“有時會出現(xiàn)簡單的推理錯誤,會輕信用戶的虛假陳述,會像人類一樣解答不了難題。”

B

值得一提的是,GPT-4在不同語種上的能力表現(xiàn)也大幅提升。

過去使用基于GPT-3.5的ChatGPT時,要特別注意中文的表達(dá)規(guī)范、流暢,即便如此它依然會時不時地突然用英文作答,好像一著急就要“蹦母語”。

根據(jù)OpenAI的技術(shù)報告,GPT-4的中文準(zhǔn)確度已經(jīng)達(dá)到了80.1%,這個數(shù)字比GPT-3.5的英文表現(xiàn)還要好,后者只有70.1%。

為了看看GPT-4的中文能力究竟如何,字母榜(ID:wujicaijing)也簡單地問了幾個問題。

我們先將一段報道GPT-4推出的英文發(fā)給ChatGPT,要其翻譯。這部分GPT-3.5和GPT-4的整體區(qū)別存在但是不明顯。如GPT-4翻譯為“人工智能驅(qū)動的法語或西班牙語的對話”,GPT-3.5翻譯成了“法語或西班牙語的AI驅(qū)動對話”。

當(dāng)我們進(jìn)一步提出要求時,新模型的表現(xiàn)開始明顯好于前代。比如“給年輕的朋友轉(zhuǎn)述這個消息”,GPT-4的回答很本土化:“嘿,哥們”“得告訴你個牛X的事兒”“這貨還能識別圖片”。

再讓它針對老年朋友編輯個信息,它的回答則有那種正經(jīng)的味道,如“親愛的朋友”“告訴你個好消息”“感嘆時光荏苒啊”。

反觀GPT-3.5,回答得就略顯生硬了,雖然也努力地加入了語氣詞等,但是整體文本還是欠缺重新梳理,依舊是對原文本的簡單復(fù)制。

當(dāng)我們讓GPT-4模仿莎士比亞轉(zhuǎn)達(dá)這個消息時,其回答頗為驚艷:“哉!眾生皆驚,乃OpenAI新奇之作——GPT-4誕生矣!其智慧之光,如同破曉之陽,識圖問答皆無往不利……”但GPT-3.5則顯示發(fā)來一大段英文,當(dāng)我們要求用中文時,文本不能說和莎翁有什么關(guān)系,最多是有點譯制片腔調(diào):“哦!快來聽聽這個消息……”

接下來,是社交媒體文案比拼。我們讓ChatGPT將之前的消息壓縮為100字左右的小紅書文案,GPT-4直接給出了完整的標(biāo)題、文案甚至是話題標(biāo)簽。而且文本中插入了很多小紅書常見的emoji表情,達(dá)到了可以直接拿來用的程度。

GPT-3.5雖然也知道小紅書的風(fēng)格是更親和的,但是文本簡潔度明顯差很多,也不懂得emoji的奧妙。

我們還讓CgatGPT為一款游戲手機(jī)的新顏色起名字,GPT-3.5給出的10個名字中,只有1個不帶“綠”字,如翡翠光芒綠、草原之綠、碧海琉璃綠,和游戲的聯(lián)系也不緊密。GPT-4給出的名字則可以直接取用:極速碧輝、虛擬翠穹、綠焰戰(zhàn)魂、綠光戰(zhàn)神。

為結(jié)束這段小小的測試,我們假設(shè)李白穿越到現(xiàn)代,并和ChatGPT進(jìn)行了一場對話,讓它以李白的角色作一首詩:

仙人撫我頂,托我躍千年。一覺醒來世事變,靈犀探盡塵間塵。玉宇瓊樓矗立地,鐵馬火車踏空間。時光如夢,逐浪逝,李白驚嘆人間情。

這“仙人撫我頂,托我躍千年”可比GPT-3.5開頭給出的“深閨無物我獨來,相見ChatGPT意外來”頂多了。

C

去年11月30日,ChatGPT上線得靜悄悄,OpenAI的官方推特賬號發(fā)布了一篇文章,宣布產(chǎn)品發(fā)布的好消息。

短短不到三個月之后,當(dāng)OpenAI發(fā)布新一代大型多模態(tài)模型GPT-4時,情況大有不同:

OpenAI在推特、YouTube等平臺發(fā)布了宣傳短視頻、產(chǎn)品介紹短視頻,還由公司總裁兼聯(lián)合創(chuàng)始人格雷格親自進(jìn)行了長達(dá)近半小時的直播。

除此之外,OpenAI還在官網(wǎng)發(fā)布了長達(dá)98頁的技術(shù)報告,并同步開放了GPT-4的API(應(yīng)用程序編程接口)以幫助開發(fā)人員構(gòu)建應(yīng)用和服務(wù)。

GPT-4讓OpenAI的商業(yè)前景廣闊了起來。在針對C端每月20美元的訂閱使用以外,外部合作也有更多可能性。

已經(jīng)有多個合作伙伴接入了GPT-4。微軟確認(rèn)了必應(yīng)的聊天機(jī)器人使用的正是GPT-4:“如果您在過去五周內(nèi)的任何時間使用過新版必應(yīng),那么您已經(jīng)體驗過GPT-4的早期版本。”

語言學(xué)習(xí)軟件多鄰國(Duolinguo)宣布將在其付費訂閱MAX版本中,為學(xué)習(xí)者提供AI驅(qū)動的新功能。比如學(xué)習(xí)者可以和軟件中的“世界人物”進(jìn)行角色扮演,練習(xí)對話技巧。AI會在對話后給出反饋,告訴學(xué)習(xí)者其回答的準(zhǔn)確性和復(fù)雜性如何,還會對未來的對話予以提示。

另一款產(chǎn)品BeMyEyes也將搭載GPT-4,而且側(cè)重的是其圖像識別和解讀的能力。BeMyEyes不是一款新應(yīng)用,它推出于2015年,為視障人士服務(wù):沒有視力障礙的人可以申請成為平臺志愿者,接聽視障人士的視頻通話,通過攝像頭遠(yuǎn)程幫助視障人士識別物品、閱讀文本等。這款應(yīng)用在中國也有使用者,小紅書、豆瓣等平臺都有相關(guān)討論。

可以想見,有了GPT-4的讀圖能力,視障人士有望在平臺獲得更及時、私密的幫助。

對于其他想要合作的開發(fā)者,需要進(jìn)入GPT-4的API接口申請頁面,填寫姓名、郵件、公司組織編號以及使用計劃等問題。

已經(jīng)有公司迫不及待。

人工智能公司DoNotPay的CEO喬舒亞(Joshua Browder)在推特上表示,正在致力于用GPT-4打擊騷擾電話,將其稱為“一鍵訴訟”。針對騷擾電話和自動撥號軟件起草起訴書,要求對方賠償1500美元:“想象一下,你接了個電話,按了一個鍵,然后1000詞的起訴書就寫好了?!?/p>

此前,這家公司基于包括ChatGPT和Davinci在內(nèi)的文本生成器,訓(xùn)練和開發(fā)了“全球第一個AI律師”。本來有計劃今年2月在美國出庭辯護(hù),卻因爭議不得不擱置。

有人興奮,有人發(fā)愁。谷歌此前以聊天機(jī)器人巴德(Bard)迎戰(zhàn)與ChatGPT深度合作的微軟,但還沒對外公開發(fā)布產(chǎn)品,就因為演示頁面中的錯誤一夜蒸發(fā)千億市值。

而就在GPT-4發(fā)布之前,谷歌才宣布了一個新消息,稱將推出一系列AIGC(人工智能生成內(nèi)容)的功能,將AI應(yīng)用到包括谷歌文檔(Docs)、郵箱(Gmail)等的生產(chǎn)力工具當(dāng)中,并于月底提供給“可信賴的開發(fā)人員”。然而這個消息還沒掀起多大波浪,就被GPT-4的出世沖淡了。

另一邊,在國內(nèi),百度也將于3月16日舉行文心一言發(fā)布會。這是百度備受矚目的大語言模型產(chǎn)品。轉(zhuǎn)眼間,扳手腕的對象從GPT-3.5升級成了GPT-4,實在不算是個好消息。

對于ChatGPT和微軟的競爭對手來說,GPT-4再一次搶了先機(jī)。對于你我來說,究竟是應(yīng)當(dāng)興奮于科技的發(fā)展,還是恐懼于被替代,不妨先讓子彈飛一會兒。

關(guān)鍵詞:

相關(guān)閱讀:
熱點
圖片 圖片