首頁(yè)>資訊 >
網(wǎng)聊一個(gè)月,殺豬盤(pán)騙子竟被AI整破防,200萬(wàn)網(wǎng)友大呼震撼 2023-01-06 14:44:54  來(lái)源:36氪

說(shuō)起「殺豬盤(pán)」,大家肯定都恨得牙癢癢。

在這類(lèi)交友婚戀類(lèi)網(wǎng)絡(luò)詐騙中,騙子會(huì)提前物色好容易上鉤的受害者,而她們,往往是單純善良、對(duì)愛(ài)情懷有美好幻想的高知乖乖女。


【資料圖】

而為了能和這些騙子大戰(zhàn)500回合,B站大名鼎鼎的科技圈up主「圖靈的貓」訓(xùn)練了一個(gè)聊起天來(lái)頻出爆梗,甚至比真人還6的AI。

結(jié)果,隨著AI的一通操作,騙子竟然被這個(gè)以假亂真的小姐姐搞得方寸大亂,直接給「她」轉(zhuǎn)了520。

更好笑的是,發(fā)現(xiàn)根本無(wú)機(jī)可乘的騙子,最后不僅自己破了防,還被AI附送一段「名句」:

視頻一出,立刻爆火,在B站沖浪的小伙伴們紛紛被刷屏。不到一個(gè)月,播放量就已經(jīng)接近兩百萬(wàn)。

三句話,讓騙子v我520

不過(guò),這個(gè)過(guò)程看似輕巧,但想請(qǐng)騙子入甕,鉤直餌咸肯定是不行的。

為此,「圖靈的貓」也是煞費(fèi)苦心。

他不僅在多個(gè)社交平臺(tái)注冊(cè)了賬號(hào),而且還根據(jù)公安部發(fā)布的受害者畫(huà)像,為賬號(hào)定位了單身渴望愛(ài)情、多金、高學(xué)歷乖乖女等身份標(biāo)簽。

果不其然,賬號(hào)剛注冊(cè)好,私信就直接爆炸。

同時(shí),為了避免誤傷,「圖靈的貓」根據(jù)公安部公布的詐騙犯畫(huà)像,設(shè)定了嚴(yán)格的篩選條件,只有同時(shí)滿足以下幾點(diǎn)的人才會(huì)讓AI接管對(duì)話:

經(jīng)過(guò)一系列過(guò)濾,最終有14位嫌疑人脫穎而出,他們與AI的對(duì)話過(guò)程也被全程記錄。

下面我們就看看,其中一位「天選之子」,是采用什么手段「殺豬」,又是怎么被AI小姐姐「調(diào)戲」到七竅生煙的。

值得注意的是,為了讓AI學(xué)會(huì)「看菜下飯」,「圖靈的貓」喂的語(yǔ)料主要抽取自B站和貼吧的熱門(mén)評(píng)論,因此這位AI小姐姐和騙子對(duì)話時(shí),可謂是爆梗頻出,滿嘴金句。

可以看到,一上來(lái),騙子就套路滿滿,想通過(guò)旁敲側(cè)擊,摸清小姐姐的家底。

不經(jīng)意間,騙子「隱隱約約」露富,小秀了一把,AI小姐姐當(dāng)然是十分配合地捧場(chǎng)啦。

隨后,騙子玩起了「哥很忙」這一套,很可能是去找新的受害者下手了。欲擒故縱這一招,實(shí)在是6。

第二天,騙子要開(kāi)始扮演「志趣相投」的知己了。他看到了AI小姐姐在朋友圈發(fā)的電影截圖,開(kāi)始往這方面找話題。

他也不藏著掖著,很快打出了直球:「我像蓋茨比,你就是戴西」。很明顯,AI還不會(huì)接這種直球,她的回復(fù)讓騙子有點(diǎn)懵逼。

第四天,騙子開(kāi)始反客為主,說(shuō)起了騷話,對(duì)話進(jìn)入了確立關(guān)系環(huán)節(jié)。

三周后,騙子發(fā)來(lái)了金額為520的紅包。

隨后,還用盜來(lái)的網(wǎng)圖秀起了肌肉。雖然是網(wǎng)圖,但倒也挺符合人設(shè)的。

在5-8周時(shí),騙子果然開(kāi)始正式「殺豬」了。

他開(kāi)始聲東擊西,對(duì)AI小姐姐「賣(mài)慘」,一開(kāi)口就是要50w。

而騙子口中的這個(gè)元宇宙項(xiàng)目,在好幾周前就埋下伏筆了。

看到對(duì)方并沒(méi)有上套,騙子說(shuō)小姐姐不在意兩個(gè)人的感情,開(kāi)始「難過(guò)」了。而小姐姐就倆字:沒(méi)錢(qián)!

騙子再接再厲,開(kāi)始慫恿小姐姐朝自己的家人下手。

而AI小姐姐此時(shí)放出大招:「要不你借我點(diǎn)錢(qián),等我湊齊了一塊投進(jìn)去?」

發(fā)現(xiàn)自己很難「殺」到「豬」,騙子開(kāi)始惱羞成怒了。

罵完人之后,騙子開(kāi)始準(zhǔn)備金蟬脫殼,要求小姐姐刪掉記錄,試圖讓以后的立案?jìng)刹殡y上加難。

面對(duì)騙子的PUA,AI小姐姐發(fā)出直擊靈魂的疑問(wèn):「什么感情」?一句話讓騙子開(kāi)始無(wú)能狂怒。

最終,騙子徹底破大防。AI發(fā)出諸葛軍師的名言,測(cè)試結(jié)束。

而這種過(guò)程中很有趣的一點(diǎn)是,AI表現(xiàn)得并不完美,時(shí)有破綻,但騙子往往選擇忽略——畢竟對(duì)他們來(lái)說(shuō),受害人越不聰明,上鉤概率越大。

而騙子的520元魚(yú)餌錢(qián),「圖靈的貓」也捐給了韓紅基金會(huì)。

「最新殺豬攻略」

雖然AI大戰(zhàn)騙子的過(guò)程看得人大快人心,但殺豬盤(pán)的背后,是觸目驚心、充滿血淚的一樁樁案件,甚至一條條生命。

「圖靈的貓」已經(jīng)用AI篩選出了兩位數(shù)的騙子,并把可疑賬號(hào)交給了警方。接警小哥說(shuō),這類(lèi)案件每天都有,非常難破,一般都是境外黑號(hào),錢(qián)轉(zhuǎn)過(guò)去就會(huì)很快被洗走。

正是因?yàn)檫@種詐騙犯一般在境外,即使報(bào)警也難以破案。而我們唯一能做的,就是建立好反詐意識(shí),給自己內(nèi)心上一道防線。

此外,更可怕的是,騙子的努力,你根本想象不到。為了放長(zhǎng)線,他們惡補(bǔ)各種知識(shí),熟知火影海賊、JoJo、扳機(jī)社、刀塔、原神、逆水寒。甚至還能心算EBIDA、手寫(xiě)C++,幫找大廠內(nèi)推。

具體來(lái)說(shuō),一個(gè)完整的「殺豬盤(pán)」,有著嚴(yán)格的腳本和流程。

首先,騙子會(huì)在各種「交友APP」上找到符合上述人設(shè)的女性。這一過(guò)程被稱為「找豬」。

加上微信后,騙子會(huì)向受害者展示自己朋友圈里的精心展示形象——成熟體貼,溫柔,金融行業(yè)……重重buff疊加,讓女性心動(dòng)不已。這一過(guò)程被稱為「喂豬」。

「喂豬」完成后,騙子就會(huì)開(kāi)始追求女性,通過(guò)種種甜言蜜語(yǔ)和體貼的舉動(dòng),讓女性產(chǎn)生「天降完美男友」的感受,對(duì)騙子建立起完全的信任。

這番高級(jí)的PUA之后,就來(lái)到了「殺豬」的環(huán)節(jié)。

騙子會(huì)以為兩個(gè)人的未來(lái)努力為名義,引導(dǎo)女性受害者投入錢(qián)財(cái)。頭一兩筆,會(huì)讓受害者掙一點(diǎn)錢(qián)。

而當(dāng)受害者放下防備,可能就會(huì)把自己的積蓄盡數(shù)投入,走進(jìn)騙子鋪好的天羅地網(wǎng)中。

而因?yàn)闅⒇i盤(pán)具有模式化、規(guī)則化的特點(diǎn),「圖靈的貓」選擇用AI來(lái)迎戰(zhàn)騙子,正巧是利用了殺豬盤(pán)的規(guī)則,屬于「用魔法打敗魔法」。

他訓(xùn)練出來(lái)的AI,仿佛加了一個(gè)「思想鋼印」,只要對(duì)面說(shuō)出「投資」「理財(cái)」之類(lèi)的話,AI就會(huì)瞬間觸發(fā)機(jī)制。

而如今被各類(lèi)詐騙包圍的我們,也應(yīng)該給自己打上這些「思想鋼印」,當(dāng)有陌生人打聽(tīng)家里情況、談起投資、推薦APP時(shí),要立刻遠(yuǎn)離或拉黑。

熱梗濃度超標(biāo)的聊天機(jī)器人

其實(shí)在此之前,圖靈的貓也曾經(jīng)開(kāi)發(fā)過(guò)不少文本創(chuàng)作型的AI,但由于缺乏知識(shí)圖譜和QA設(shè)計(jì),就連up主自己都吐槽說(shuō),它們交流起來(lái)宛如一個(gè)智障。

為此,up主特地制作了一個(gè)全新的的生成式對(duì)話AI——AntiFraudChatBot。

基于大規(guī)模預(yù)訓(xùn)練中文模型、語(yǔ)義識(shí)別與檢測(cè)、對(duì)話意圖等技術(shù)的AntiFraudChatBot,比起傳統(tǒng)的BertQA模型或non-prompt模型,在對(duì)話的流暢度上有著顯著的提升。

不過(guò),現(xiàn)在還不能高興得太早。雖然AI說(shuō)話是利索了,但健忘的毛病還沒(méi)解決。

眾所周知,微信聊天是以多輪對(duì)話的形式進(jìn)行的。

而如此頻繁連續(xù)的對(duì)話,很容易讓AI忘記自己或?qū)Ψ街岸颊f(shuō)了些什么。

結(jié)果就是,AI答非所問(wèn),被對(duì)方一眼看穿。

為了解決這個(gè)問(wèn)題,up主參考LSTM的思想,為系統(tǒng)增加了記憶機(jī)制,讓AI能夠?qū)崿F(xiàn)簡(jiǎn)單的長(zhǎng)期對(duì)話記憶(比如昨天聊過(guò)的內(nèi)容)和短期對(duì)話記憶(上一輪對(duì)話內(nèi)容)。

具體操作如下:

將聊天記錄放入記憶區(qū),并在每次回復(fù)時(shí)計(jì)算相似度; 超過(guò)相似度閾值的歷史對(duì)話將被AI讀取使用; 設(shè)定遺忘窗口M,超過(guò)M/2輪次的對(duì)話將被pop() 。這樣,AI就能夠?qū)崿F(xiàn)簡(jiǎn)單的長(zhǎng)短期對(duì)話記憶,比如昨天聊過(guò)的內(nèi)容或上一輪對(duì)話內(nèi)容。

至于本次測(cè)試應(yīng)用的場(chǎng)景——「殺豬盤(pán)」,則是一種規(guī)則化、模式化的對(duì)話博弈。

對(duì)于擅長(zhǎng)零樣本(Zero-Shot)和小樣本(Few-Shot)學(xué)習(xí)生成式預(yù)訓(xùn)練模型,比如up主選擇用的2457億參數(shù)的「源1.0」,可以在少量(1~3個(gè))規(guī)則化的example示范下,很好地理解我們希望實(shí)現(xiàn)的「對(duì)話策略」,比如反套路、用語(yǔ)料拋梗等等。

于是,為了引導(dǎo)模型有針對(duì)性地學(xué)習(xí)如何與騙子對(duì)話,up主加入了一種基于prompt example的先驗(yàn)規(guī)則。而其中用到的example語(yǔ)料,正是之前提到的B站和貼吧的熱門(mén)評(píng)論。

其實(shí),這么做的原因很簡(jiǎn)單:

1. 評(píng)論是天然的對(duì)話形式,有顯式的回復(fù)與被回復(fù)關(guān)系。

2. 自古評(píng)論出人才,一些金句和??梢园讶藱C(jī)對(duì)話變得不那么生硬。

除此之外,為了讓AI更加「像人」,up主還做了以下設(shè)計(jì):

設(shè)定每條信息的回復(fù)間隔,模擬真實(shí)打字速度 加入通用emoji來(lái)替換關(guān)鍵詞(目前還不支持表情包) 當(dāng)對(duì)方在限定時(shí)間內(nèi)發(fā)了多段文字時(shí),wechaty會(huì)hold住本輪對(duì)話直到對(duì)方結(jié)束 這種情況下,對(duì)方的輸入會(huì)被拼接成一句話之后輸入AI,而AI也只會(huì)回復(fù)一次

最后,up主采用了開(kāi)源的wechaty框架在云上搭建后端,然后通過(guò)本地的python腳本調(diào)用puppet服務(wù),讓AI無(wú)縫接入微信。

只需登錄預(yù)先注冊(cè)好的微信號(hào),AI就可以回復(fù)任意私聊或群聊了。

值得注意的是,框架中服務(wù)器端、本地端和模型端這3個(gè)模塊之間,是可以解耦并進(jìn)行單獨(dú)迭代或替換的。

目前,這個(gè)把騙子整破防的應(yīng)用已經(jīng)在Github上開(kāi)源。

項(xiàng)目地址:https://github.com/Turing-Project/AntiFraudChatBot

核心:超大規(guī)模中文AI模型

那么,到底是什么基礎(chǔ)模型,讓up主搞出了這個(gè)把騙子玩得團(tuán)團(tuán)轉(zhuǎn)的AI?

說(shuō)來(lái)也巧,up主在逛Github的時(shí)候,偶然發(fā)現(xiàn)了一個(gè)非常有趣的項(xiàng)目——AI劇本殺。

這個(gè)AI在游戲中所扮演的角色,不僅可以與其他玩家流暢對(duì)話,甚至?xí)榱诉_(dá)成任務(wù)主動(dòng)說(shuō)謊「套路」人類(lèi)玩家。

而這個(gè)項(xiàng)目,用到的便是目前國(guó)內(nèi)為數(shù)不多的開(kāi)源(劃重點(diǎn))預(yù)訓(xùn)練中文模型——「源1.0」。

AI劇本殺:https://github.com/bigbrother666sh/shezhangbujianle

當(dāng)然,這里還有一個(gè)重點(diǎn):「源1.0」的API接口不僅使用方便,而且用起來(lái)不要錢(qián)。

論文地址:https://arxiv.org/pdf/2110.04725.pdf

簡(jiǎn)單介紹一下,「源1.0」是浪潮在2021年9月發(fā)布的單體巨量自然語(yǔ)言處理模型。

相比GPT-3模型1750億參數(shù)量和570GB訓(xùn)練數(shù)據(jù)集,「源1.0」在參數(shù)規(guī)模上領(lǐng)先了40%,而在訓(xùn)練數(shù)據(jù)集規(guī)模更是領(lǐng)先了近10倍。

單體模型參數(shù)量達(dá)到2457億,這意味著模型的表達(dá)能力更強(qiáng)。 訓(xùn)練數(shù)據(jù)達(dá)到了5000G,基本涵蓋過(guò)去5年中文互聯(lián)網(wǎng)所有的優(yōu)質(zhì)文本知識(shí)。

「源1.0」一經(jīng)發(fā)布,便問(wèn)鼎全球最大規(guī)模的中文AI模型,在獲得中文語(yǔ)言理解評(píng)測(cè)基準(zhǔn)CLUE榜單的零樣本(zero-shot)學(xué)習(xí)和小樣本(few-shot)學(xué)習(xí)兩類(lèi)總榜冠軍的同時(shí),也刷新了八項(xiàng)任務(wù)最高精度。

此外,「源1.0」在當(dāng)時(shí)還登頂了中文語(yǔ)言能力理解和生成評(píng)測(cè)基準(zhǔn)CUGE(智源指數(shù))精簡(jiǎn)榜總榜榜首,并獲得語(yǔ)言理解(篇章級(jí))、語(yǔ)言生成、對(duì)話交互、多語(yǔ)言、數(shù)學(xué)推理等5項(xiàng)評(píng)測(cè)最佳成績(jī)。

ZeroCLUE零樣本學(xué)習(xí)榜單(2021年9月)

FewCLUE小樣本學(xué)習(xí)榜單(2021年9月)

算法、數(shù)據(jù)、算力及社區(qū)

算法層面,采用Transformer結(jié)構(gòu)的「源1.0」,針對(duì)注意力層和前饋層的模型空間進(jìn)行了結(jié)構(gòu)優(yōu)化,改進(jìn)了注意力機(jī)制聚焦文章內(nèi)部聯(lián)系的學(xué)習(xí)。

數(shù)據(jù)層面,浪潮針對(duì)中文訓(xùn)練數(shù)據(jù)存在的海量數(shù)據(jù)難獲取、數(shù)據(jù)難清洗和無(wú)統(tǒng)一質(zhì)量評(píng)估標(biāo)準(zhǔn)的現(xiàn)狀,浪潮自研了海量數(shù)據(jù)過(guò)濾系統(tǒng)(MDFS)。

通過(guò)建立從數(shù)據(jù)采集、粗濾、質(zhì)量分類(lèi)、精濾的全自動(dòng)化的端到端數(shù)據(jù)工作流程,清洗了866TB海量數(shù)據(jù),并由此獲得高達(dá)5TB的業(yè)界最大規(guī)模高質(zhì)量中文數(shù)據(jù)集。

算力效率層面,針對(duì)大模型訓(xùn)練中存在計(jì)算模式復(fù)雜,算力集群性能較低的情況,「源1.0」在大規(guī)模分布式訓(xùn)練中采用了張量并行、流水線并行和數(shù)據(jù)并行的三維并行策略。

同時(shí),「源1.0」還首次提出了面向效率和精度優(yōu)化的大模型結(jié)構(gòu)協(xié)同設(shè)計(jì)方法,圍繞深度學(xué)習(xí)框架、訓(xùn)練集群IO、通信展開(kāi)深入優(yōu)化。在僅采用2x200G互聯(lián)的情況下,讓算力效率達(dá)到了45%,遠(yuǎn)超MT-NLG與GPT-3等國(guó)際知名模型,算力效率世界領(lǐng)先。

除此之外,「源1.0」在發(fā)布后便打造了開(kāi)源開(kāi)放平臺(tái),供廣大開(kāi)發(fā)者開(kāi)發(fā)不同領(lǐng)域的應(yīng)用,不僅降低了AI開(kāi)發(fā)的門(mén)檻,而且還有效地提升了AI開(kāi)發(fā)的效率。

目前,「源1.0」開(kāi)源平臺(tái)已經(jīng)匯集了近3000名開(kāi)發(fā)者,并且誕生了很多有意思的應(yīng)用,比如之前提到的AI劇本殺。

網(wǎng)友評(píng)論

不得不說(shuō),強(qiáng)大的基礎(chǔ)模型再加上B站和貼吧熱評(píng)的加持,「小源」不僅能說(shuō)會(huì)道,還熟知互聯(lián)網(wǎng)黑話,句句爆梗。

以后跟網(wǎng)友聊天,非常有必要測(cè)一測(cè)對(duì)面是不是AI了。

也難怪經(jīng)過(guò)專業(yè)PUA訓(xùn)練的騙子都被耍得團(tuán)團(tuán)轉(zhuǎn)。

畢竟,公司的培訓(xùn)材料再?gòu)?qiáng),還能強(qiáng)過(guò)人才濟(jì)濟(jì)的B站和貼吧了?

對(duì)此,稚暉君表示,也許未來(lái)讓騙子失業(yè)的正是AI。

另外,也有網(wǎng)友分享了自己從未在殺豬盤(pán)里中招的訣竅,一個(gè)字——摳。

「咱們朋友做的好好的,為啥要提錢(qián)呢?你不知道這樣會(huì)連朋友都沒(méi)的做嗎?」

而四川共青團(tuán),也在評(píng)論區(qū)義正言辭地進(jìn)行了反詐宣傳。

用魔法打敗「魔」法

1月6日,在新智元與浪潮聯(lián)合舉辦的AI反詐論壇上,「圖靈的貓」就給我們?cè)敿?xì)解釋了上面這個(gè)AI大戰(zhàn)「殺豬盤(pán)」的故事。

現(xiàn)在你可能會(huì)有些好奇,為什么「殺豬盤(pán)」的騙子意識(shí)不到與自己對(duì)話的可能是一個(gè)AI呢?

首先,「源1.0」模型本身的知識(shí)儲(chǔ)備就非常大,而基于這個(gè)模型的知識(shí)儲(chǔ)備,就可以做一些更深層的應(yīng)用。比如,可以用一些短字?jǐn)?shù)的評(píng)論去訓(xùn)練和引導(dǎo)AI,讓它更加擬人。

如此一來(lái),「小源」就區(qū)別于那些動(dòng)輒發(fā)表長(zhǎng)篇大論的長(zhǎng)文本AI,可以用短句和分段表述,聊起天來(lái)就更加日常。

其次,在「殺豬盤(pán)」中,對(duì)于不同關(guān)鍵詞,騙子都是有一套邏輯的。而我們恰恰可以讓AI反著這個(gè)邏輯,為騙子準(zhǔn)備一套話術(shù)。

當(dāng)關(guān)鍵詞被觸發(fā)后,我們既可以直接進(jìn)行人為的觀察和干預(yù),也可以利用AI對(duì)騙子進(jìn)行循循善誘讓他們露出馬腳,從而幫助提升案件的偵破效率。

隨著這幾年大模型的進(jìn)步,也有不少人陷入惶恐,擔(dān)心AI的應(yīng)用會(huì)帶來(lái)風(fēng)險(xiǎn)。

對(duì)此,浪潮的觀點(diǎn)是「科技向善」——科技是一種工具,能夠更好地幫助人類(lèi),為我們帶來(lái)價(jià)值。

項(xiàng)目代碼:

https://github.com/Turing-Project/AntiFraudChatBot

模型官網(wǎng)

https://air.inspur.com/home

視頻鏈接

https://www.bilibili.com/video/BV1qD4y1h7io/?vd_source=eecf800392d116d832e90ad1c9ae70f6

關(guān)鍵詞: 海量數(shù)據(jù) 能夠?qū)崿F(xiàn)

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片