接近金牌水平,AI向人類奧數“下手”

從下棋到解析蛋白質結構,人工智能(AI)變得越來越無所不能。美國谷歌公司的DeepMind這次將目標瞄準數學領域,開發的一款AI幾何推理模型——AlphaGeometry能夠以接近國際數學奧林匹克(奧數)競賽金牌得主的水平,解決復雜的幾何問題。相關研究1月17日發表于《自然》。
奧數面向中學生每年7月舉辦,是全球最難的數學競賽之一。解決奧數幾何問題需要一定的數學創造力,而這正是AI一直在試圖攻克的。即使在其他領域展現出非凡推理能力的OpenAI的GPT-4,在奧數幾何問題上也只能得0分。
AI之所以對奧數幾何問題久攻不下,除了問題的難度外,缺乏訓練數據也是一個很重要的原因。奧數自1959年以來每年舉辦一次,且每次比賽只有6道題。然而,AI系統解決幾何問題需要數百萬甚至數十億個數據點,現有數據遠不能滿足訓練的需要。
為此,DeepMind的Thang Luong和同事創建了一種工具,可生成數以億計的機器可讀的幾何證明,從而繞過了現有數據不足的難點。
研究人員使用這些數據對AlphaGeometry進行訓練,并用30道奧數幾何題對它進行基準測試。結果,AlphaGeometry在標準時限內正確解出了25道題。相比之下,之前最先進的系統解決了其中10道題,而根據預測,人類奧數金牌得主平均解決25.9道題。
Luong介紹,AlphaGeometry由兩部分組成,一個是快速、直觀的語言模型系統——GPT-f,另一個是較慢、更具分析性的“符號引擎”系統。
面對一道奧數幾何題,AlphaGeometry首先利用GPT-f提出要嘗試的定理和論點,接著“符號引擎”就會通過邏輯推理,按照數學規則構建GPT-f提出的論點。兩個系統協同工作、不斷切換,直到問題解決。
Luong表示,雖然AlphaGeometry在解決奧數幾何題方面非常成功,但它的答案往往比人類的證明更長。不過,它可以發現一些人類遺漏的東西。比如,它對一道2004年奧數競賽題的解法,比官方給出的答案更好、更通用。
英國倫敦數學科學研究所的何楊輝指出,該系統在可用的數學運算方面存在固有的局限性,因為奧數問題應該用大學本科階段以下教授的定理來解決。因此,增加AlphaGeometry可以獲得的數學知識能夠改善系統,甚至有助于它取得新的數學發現。
目前,DeepMind拒絕透露是否計劃讓AlphaGeometry參加奧數現場比賽,以及是否再擴展該系統以解決其他非幾何奧數問題。
(徐銳)
相關論文信息:
https://doi.org/10.1038/s41586-023-06747-5
本文鏈接:http://knowith.com/news-7-141.html接近金牌水平,AI向人類奧數“下手”
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
《北京經濟技術開發區關于鞏固和增強經濟回升向好態勢的若干措施》
【解讀】知識產權制度體系不斷完善
【解讀】提升專利質量促進轉化運用——《專利轉化運用專項行動方案(2023-2025年)》看點解析
【解讀】《鄉村振興用地政策指南(2023年)》
關于豐臺區舉辦“豐帆行動”計劃——孵化機構推介專場的通知
一周前沿科技盤點〔77〕丨激光萬般絢爛,“10拍瓦上限”突破;絕美的大質量原恒星團,并非朝夕“養成”
接近金牌水平,AI向人類奧數“下手”
北航破解“折翼”無人機飛行難題
50億科創母基金在天津發布
【公示】第一批北京工業遺產擬認定名單公示
正常價發布:印度-老撾-孟加拉卡博替尼一盒多少錢,2025老撾印度卡博替尼真正價格在799起
揭曉阿帕他胺多少錢一盒?國內代購印度阿帕他胺(60mg120粒)多少錢一盒一瓶?2025購買價格揭曉:不出國代購印度阿帕他胺價格范疇約2200~2900元一盒!
鏗鏘有力:羊小咩的額度怎么套出來(干貨分享5個秒到方法)
熱點討論!印度替莫唑胺哪里買:推薦三種購買渠道!
喜笑顏開:佛山代還信用卡取現,可長期合作,多年經驗誠信
篤學好古:DY月付怎么套出來,推薦三個常用方法
攤上:京東白條有額度如何自己套出來,輕松7種流程方法
解析:京東白條最新取現方法(最簡單的5種方法)-知者
步步高升:正規蘋果id貸款,蘋果id貸款口子2024
流眄:成都區域上門信用卡墊還使用實操流程公布