谷歌研究登《自然》:AI幾何能力接近人類奧數(shù)金牌選手

人工智能(AI)再破紀(jì)錄,這一次,它挑戰(zhàn)的是奧數(shù)金牌!
谷歌DeepMind最新發(fā)布的幾何推理模型AlphaGeometry,成功回答了國際數(shù)學(xué)奧林匹克競賽(IMO)30個(gè)幾何問題中的25個(gè),這一成就接近于人類奧數(shù)金牌選手的水平。昨天,隨著相關(guān)研究成果登上《自然》雜志,再次引發(fā)學(xué)術(shù)界的熱議與討論。
除了AI在數(shù)學(xué)領(lǐng)域表現(xiàn)出來的巨大潛力,一些業(yè)內(nèi)人士指出,這項(xiàng)成果實(shí)際上代表著,AI再度向人類的推理能力邁進(jìn)了一大步。在很短的時(shí)間里,這些開創(chuàng)性的工作正推動(dòng)AI以驚人的速度迭代。
“AI的推理和建模能力已達(dá)到了一個(gè)新高度,其進(jìn)化的速度比我們想象的快得多。”上海交通大學(xué)智能計(jì)算研究院院長葛冬冬教授在接受本報(bào)記者采訪時(shí)如是說。
AI在數(shù)學(xué)推理方面,取得開創(chuàng)性進(jìn)展
在AlphaGeometry問世之前,AI的推理能力一直“不太行”,也難以解決幾何和數(shù)學(xué)方面的復(fù)雜問題。
但現(xiàn)在,AlphaGeometry展示了AI最新具備的邏輯推理能力,以及發(fā)現(xiàn)和驗(yàn)證新知識(shí)的能力。在對30道奧數(shù)幾何題的基準(zhǔn)測試中,AlphaGeometry在標(biāo)準(zhǔn)奧數(shù)時(shí)限內(nèi)解決了25道——與人類奧數(shù)金牌得主平均解決25.9個(gè)問題的水平不相上下。和之前最先進(jìn)的AI系統(tǒng)解決其中10個(gè)幾何問題的表現(xiàn)相比,AlphaGeometry可謂實(shí)現(xiàn)了史詩級升級。
在解決幾何問題方面,該模型幾乎趕上了最聰明的人類。一位IMO金牌得主受邀作為評審,連連稱贊AlphaGeometry的輸出結(jié)果不僅可以經(jīng)得起驗(yàn)證,而且表述清晰。不僅如此,在回答奧數(shù)真題時(shí),AlphaGeometry還發(fā)現(xiàn)了2004年國際數(shù)學(xué)奧林匹克競賽定理的一個(gè)新版本。
在業(yè)界,具備更強(qiáng)的定理證明能力,一直是AI研究的焦點(diǎn)。比如,對于大模型來說,學(xué)習(xí)定理證明很困難。要知道,OpenAI去年發(fā)布的GPT-4,可是連一道奧數(shù)題都做不出來!
“可以說,AI在數(shù)學(xué)推理方面取得了開創(chuàng)性進(jìn)展。”如今任教于高校的葛冬冬,在學(xué)生時(shí)代也曾是一位奧數(shù)選手。他直言,雖然AlphaGeometry表現(xiàn)搶眼,但也要看到其局限性。因?yàn)镮MO的賽題通常有六道,分為好幾種類型,此次的新模型專注于解決幾何類賽題,范圍相對狹窄。“但可以預(yù)見,類似AlphaGeometry的能力,應(yīng)該在很短的時(shí)間里就可以覆蓋到更多數(shù)學(xué)領(lǐng)域,比如數(shù)論、方程等等。”
正如DeepMind研究人員所說的那樣,未來更大的挑戰(zhàn)在于,AI是否能發(fā)現(xiàn)新的數(shù)學(xué)方法,解決迄今的未解之謎。AI的下一個(gè)目標(biāo)就是:創(chuàng)建能夠處理超越人類思維的數(shù)學(xué)問題的人工智能系統(tǒng)。
解決復(fù)雜問題,AI有機(jī)會(huì)取得更大進(jìn)展
更大的影響,在數(shù)學(xué)之外。就在上個(gè)月,DeepMind還提出了一種名為FunSearch的新方法,首次利用大型語言模型在數(shù)學(xué)領(lǐng)域未解之謎及更多科學(xué)的挑戰(zhàn)性問題上取得新發(fā)現(xiàn)。相關(guān)成果同樣發(fā)表于《自然》。日前,DeepMind聯(lián)合創(chuàng)始人兼首席AGI科學(xué)家謝恩·萊格明確表示,“離通用人工智能(AGI),越來越近了。”
復(fù)旦大學(xué)特聘教授林偉昨天接受本報(bào)記者采訪時(shí)指出,谷歌Deepmind團(tuán)隊(duì)專注于一個(gè)垂直領(lǐng)域,生成了專業(yè)的、大規(guī)模的數(shù)據(jù)集。從目前AI的進(jìn)展來看,精耕于某一領(lǐng)域,做好數(shù)據(jù)集標(biāo)記和大規(guī)模專業(yè)數(shù)據(jù)收集測試,同時(shí)發(fā)展構(gòu)建精調(diào)模型架構(gòu)與參數(shù),是通向AGI的關(guān)鍵之徑。他認(rèn)為,對于復(fù)雜問題的解決,AI有機(jī)會(huì)取得更大的進(jìn)展。但實(shí)現(xiàn)的前提是,需要具備專業(yè)的數(shù)據(jù)、好的計(jì)算模型架構(gòu)以及可計(jì)算的應(yīng)用場景。
讓人難忘的是,過去一年里,全球多個(gè)AI大模型各展所長,已然在應(yīng)用領(lǐng)域掀起巨大變革。以GPT-4為例。通過適當(dāng)?shù)囊龑?dǎo)和訓(xùn)練,GPT-4可以根據(jù)不同制造業(yè)企業(yè)提出的小眾需求,通過建立復(fù)雜的數(shù)學(xué)模型,幫助解決實(shí)際生產(chǎn)問題。
“在復(fù)雜建模、推理和設(shè)計(jì)能力方面,AI正在以前所未有的速度提升。”葛冬冬評論說,不僅GPT-4表現(xiàn)不俗,在建模等不少方面的能力甚至達(dá)到了人類研究生的水平,如今AI解決實(shí)際問題的能力,無論是廣度還是深度,都出現(xiàn)了一個(gè)飛躍。“無論是現(xiàn)實(shí)領(lǐng)域的諸多復(fù)雜問題,還是長期存在且目前無解的科學(xué)難題,AI都開始逐步學(xué)習(xí)、理解,并進(jìn)行復(fù)雜建模。”包括葛冬冬在內(nèi),不少業(yè)界人士給出預(yù)判:接下來,大模型的迭代和進(jìn)化,一定會(huì)達(dá)到更令人不可思議的程度。
(原標(biāo)題:AI幾何能力接近人類奧數(shù)金牌選手,谷歌DeepMind研究成果登上《自然》 AI進(jìn)化速度“比想象的快得多”)
本文鏈接:http://knowith.com/news-2-50.html谷歌研究登《自然》:AI幾何能力接近人類奧數(shù)金牌選手
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
關(guān)于印發(fā)《北京市集成電路專業(yè)職稱評價(jià)試行辦法》的通知(京人社事業(yè)發(fā)〔2023〕41號(hào))
【解讀】《鄉(xiāng)村振興用地政策指南(2023年)》
關(guān)于促進(jìn)民營經(jīng)濟(jì)發(fā)展壯大的意見
關(guān)于印發(fā)2024年北京市高精尖產(chǎn)業(yè)發(fā)展資金實(shí)施指南的通知
關(guān)于開展智能網(wǎng)聯(lián)汽車“車路云一體化”應(yīng)用試點(diǎn)工作的通知(工信部聯(lián)通裝〔2023〕268號(hào))
關(guān)于印發(fā)《科技倫理審查辦法(試行)》的通知(國科發(fā)監(jiān)〔2023〕167號(hào))
“創(chuàng)客北京2023”創(chuàng)新創(chuàng)業(yè)大賽順義區(qū)級賽暨第四屆“創(chuàng)新順義”創(chuàng)新創(chuàng)業(yè)大賽啟動(dòng)的通知
【解讀】北京市通州區(qū)人民政府辦公室印發(fā)關(guān)于《北京市積極應(yīng)對疫情影響助企紓困的若干措施》落實(shí)指引的通知(通政辦發(fā)〔2022〕26號(hào))
內(nèi)蒙古準(zhǔn)格爾經(jīng)濟(jì)開發(fā)區(qū)“碳尋”固廢綜合利用路徑
《工業(yè)領(lǐng)域數(shù)據(jù)安全能力提升實(shí)施方案(2024-2026年)》
大吉大利:深圳鹽田代還信用卡墊還,口碑商戶多年經(jīng)驗(yàn)誠信
秒懂:京東白條額度怎么套出來的-本文詳細(xì)講解過程步驟
雷軍親自挖人!為95后“天才少女”開出千萬年薪
好家伙:白條的錢如何套取出來(2024最新秒到提現(xiàn)介紹)
大吉大利:佛山代還信用卡取現(xiàn),真實(shí)商戶積分,價(jià)格最低的地方
心曠神怡:上海普陀區(qū)代還信用卡怎么套取出來(一手商家無中介差價(jià))
歡欣鼓舞:鄭州管城回族區(qū)上門代還信用卡,分享四大方法,最新操作秒到方法
精益求精:羊小咩享花卡額度怎么套出來,分享五個(gè)最新套方法
積極進(jìn)取:蘋果id貸口子7p,蘋果id貸款app有哪些
三分鐘必看:DY月付額度如何套出秒到!回顧今天: