首頁>資訊 >
全球速看:基于獨創(chuàng)的“數(shù)據(jù)克隆”技術,南棲仙策專注通用智能決策 2023-03-15 06:01:23  來源:36氪

人工智能正在迎來新一輪的熱潮。自ChatGPT上線以來,自然語言處理的發(fā)展?jié)摿χ饾u被認可,人們開始相信人工智能具有像人類一樣智能的可能性,通往通用人工智能(AGI)的路程又近了一步。然而,深度學習泰斗、圖靈獎得主Yan LeCun認為,ChatGPT并不能做規(guī)劃決策,因此還沒有“真正的智能”,并認為通往“真正智能”的關鍵環(huán)節(jié)是“世界建?!?。有了世界模型,就可以在其中求解最優(yōu)決策。因此,在ChatGPT實現(xiàn)通用語言智能之后,進一步值得關注的人工智能領域是通用智能決策。

南棲仙策是一家專注研究通用智能決策的公司,由南京大學人工智能創(chuàng)新研究院技術孵化,自2019年起,基于自主探索的強化學習、環(huán)境模擬、策略遷移、深度學習等技術,推動智能決策在現(xiàn)實場景落地。


(資料圖片)

在人工智能領域,視覺技術和自然語言處理技術都有了較大進展,但自AlphaGo在圍棋上戰(zhàn)勝人類后,決策領域人工智能的發(fā)展一直相對緩慢。在決策領域,落地的關鍵并不是決策本身,而是對任務的建模,即LeCun提到的“世界模型”,如圍棋世界就有著一套游戲規(guī)則,然而,現(xiàn)實世界很難找到直接的規(guī)則和模型。

這背后還有困擾工業(yè)場景的一個大問題——場景復雜、數(shù)據(jù)少、數(shù)據(jù)不全。工廠數(shù)字化是近幾年的產(chǎn)物,工業(yè)環(huán)境大多非常復雜,通過專家經(jīng)驗很難準確還原出真實環(huán)境模型,因此無法通過AI來真正實現(xiàn)決策控制,并且工業(yè)里的大量生產(chǎn)數(shù)據(jù)、歷史數(shù)據(jù)都是缺失的,這會影響人工智能算法訓練所需的數(shù)據(jù)效果——有限的數(shù)據(jù)類型和范圍會影響信息處理能力,而數(shù)據(jù)量少則會限制人工智能算法的可演化空間。

南棲仙策研究了一種“數(shù)據(jù)克隆”的科技,可以實現(xiàn)從歷史數(shù)據(jù)完成環(huán)境建模的過程,它可以從有限的數(shù)據(jù)尋找出其底層的技術原理,再克隆出更多的數(shù)據(jù),幫助對決策引擎的訓練,通過在虛擬世界中推演億萬種結果,找到通向未來的最優(yōu)決策,突破人類“有限理性”的局限,即只能基于有限信息推演出有限的決策方案。

當行業(yè)內(nèi)公司大都選擇做無模型訓練的時候,南棲仙策選擇了一種基于“世界模型”的強化學習路線。南棲仙策創(chuàng)始人兼CEO俞揚告訴36氪,ChatGPT通過增加人工反饋的環(huán)節(jié),幫助模型學會對人價值觀的總結,形成打分函數(shù),再通過最大化得分自動調(diào)整模型,使其符合人類的價值觀;與此相通的是,南棲仙策基于歷史數(shù)據(jù)抽象出系統(tǒng)背后的原理,形成打分函數(shù),再通過最大化得分自動生成大量符合原理的數(shù)據(jù),從而完成精確的建模。

當被問到?jīng)Q策引擎精準性時,俞揚表示,基于“數(shù)據(jù)克隆”的技術,我們通過已收集數(shù)據(jù)生成更長時間維度的數(shù)據(jù),以此保證結果的相對精準性。而對于尚未收集到的數(shù)據(jù),如工廠高溫爆炸等極端情況下的數(shù)據(jù),則可以通過設置安全操作邊界等方式保障模型的安全性。

而這套技術也經(jīng)過了產(chǎn)業(yè)持續(xù)迭代過程中的工程積累。早在2017年,俞揚就通過該技術服務了淘寶搜索團隊,幫助其實現(xiàn)了數(shù)據(jù)驅動環(huán)境虛擬化和零試錯強化學習算法;2018年,該技術和滴滴出行合作,驗證了算法的通用性;在多年的產(chǎn)業(yè)迭代中,逐漸發(fā)現(xiàn)了融合因果反事實推斷等原理、提出環(huán)境模型因果建模等方法,核心技術完成了數(shù)十次的迭代升級。

這套通用AI決策能基于少量數(shù)據(jù)和主動學習,滿足不同復雜度業(yè)務的需求;可以對億萬種結果自主推演,獲取最大效用策略, 進而提供現(xiàn)實世界自主決策;此外,落地時以低代碼設計形式存在,上手容易。

目前,南棲仙策提供的是一個軟硬件一體化的解決方案,「仙啟REVIVE」是南棲仙策基于數(shù)據(jù)驅動強化學習開發(fā)的智能決策軟件,通過導入歷史數(shù)據(jù),轉化為強大的決策引擎,能夠將復雜的決策過程梳理成可操作的業(yè)務流程,通過頂尖算法構建“世界模型”,幫助實現(xiàn)通用性場景環(huán)境模型構建及智能決策;硬件層面,南棲仙策的智能控制器已實現(xiàn)了和市面上常見裝備接口的連接,可以直接采集工廠已有數(shù)據(jù),也可通過安裝傳感器的方式,在不改變企業(yè)現(xiàn)有控制系統(tǒng)或單元基礎上實現(xiàn)不停產(chǎn)智能化改造升級。

基于環(huán)境虛擬的強化學習

在產(chǎn)品研發(fā)過程中,南棲仙策可以構建動態(tài)虛擬環(huán)境,減少企業(yè)試驗設計中的迭代次數(shù),加快研發(fā)過程;在水務場景,南棲仙策通過強化學習的方式優(yōu)化了泵組壓力控制,能實現(xiàn)水廠泵房泵組的整體效用最大化,降低資源損耗超過10%;在資源配置場景,南棲仙策通過「仙啟」系統(tǒng)學習得到的配置策略,是候選技術中唯一超越人工配置的方案。

公司產(chǎn)品已進入成熟階段,且對焦了發(fā)力的主要場景——智慧城市的基礎設施,如水務、電網(wǎng)等場景,并在汽車底盤控制、藥物動力學等場景孕育新的應用。其場景選擇的邏輯,一是尋找可復制、具有商業(yè)價值的場景;二是公司技術在該領域有著更好的解決效果。

由于驗證周期短,智慧水務是南棲仙策當下的主力場景,2023年,公司會朝著智慧電網(wǎng)、智慧工廠等場景拓展。以電網(wǎng)場景為例,隨著新能源加入,電網(wǎng)和電廠會有較大的波動,南棲仙策的產(chǎn)品可以幫助電網(wǎng)調(diào)度做更多智能決策。

在創(chuàng)始團隊上,公司創(chuàng)始人兼CEO俞揚是南京大學人工智能學院的教授,目前,南棲仙策共有七十多名員工,研發(fā)占比70%。在自主研發(fā)能力方面,南棲仙策的研究成果已發(fā)表在NeurIPS、ICLR等人工智能國際頂級會議,公司擁有40余項知識產(chǎn)權。公司在2023年會加大銷售團隊和業(yè)務團隊的拓展。

關鍵詞:

相關閱讀:
熱點
圖片 圖片