當前位置:首頁(yè) > 百科 > 正文內容

數學(xué)界的AlphaGo時(shí)刻:谷歌DeepMind AI 19秒解 IMO幾何題,僅差1分即可摘金牌

周口門(mén)裝訂4個(gè)月前 (07-25)百科11
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

高級數學(xué)推理是現代人工智能的關(guān)鍵能力。今天,Google宣布了一項長(cháng)期重大挑戰中的一個(gè)重要里程碑:Google混合人工智能系統在今年的國際數學(xué)奧林匹克競賽(IMO)中獲得了相當于銀牌的成績(jì)

具體來(lái)說(shuō)google展示了第一個(gè)以銀牌級別解決國際數學(xué)奧林匹克問(wèn)題的人工智能

它結合了 AlphaProof(一種新的突破性形式推理模型)和 AlphaGeometry 2(之前系統的改進(jìn)版本)

國際數學(xué)奧林匹克競賽是全球最悠久、規模最大、最具聲望的青年數學(xué)家比賽,自1959年起每年舉辦一次。參賽者需要解決六道涉及代數、組合學(xué)、幾何和數論的極其困難的問(wèn)題。許多菲爾茲獎得主曾在青年時(shí)期代表國家參加過(guò)IMO。近年來(lái),IMO也成為了機器學(xué)習領(lǐng)域的一個(gè)重要挑戰,被視為衡量人工智能系統高級數學(xué)推理能力的標桿

在今年的比賽中,DeepMind的AI系統獲得了28分(滿(mǎn)分42分),相當于銀牌獲得者的水平。這一成績(jì)僅差1分就能達到金牌標準,而在今年的609名參賽者中,只有58人獲得了金牌

AlphaProof:形式化數學(xué)推理的突破

AlphaProof系統采用強化學(xué)習方法,將預訓練的語(yǔ)言模型與AlphaZero算法相結合。這種方法的優(yōu)勢在于可以正式驗證涉及數學(xué)推理的證明的正確性。為了克服形式化語(yǔ)言訓練數據不足的問(wèn)題,研究團隊通過(guò)微調Gemini模型,創(chuàng )建了一個(gè)包含各種難度的形式化問(wèn)題庫

AlphaProof是一個(gè)自學(xué)習系統,專(zhuān)門(mén)用于在形式化數學(xué)語(yǔ)言L(fǎng)ean中證明數學(xué)陳述。它的核心創(chuàng )新在于結合了預訓練語(yǔ)言模型和AlphaZero強化學(xué)習算法

工作流程如下:

1.問(wèn)題轉化:首先,使用經(jīng)過(guò)微調的Gemini模型將自然語(yǔ)言的數學(xué)問(wèn)題自動(dòng)轉換為L(cháng)ean的形式化語(yǔ)言。這一步驟創(chuàng )建了一個(gè)大型的形式化問(wèn)題庫,涵蓋不同難度級別

2.解決方案生成:面對一個(gè)新問(wèn)題時(shí),AlphaProof會(huì )生成可能的解決方案

3.證明搜索:系統在Lean中搜索可能的證明步驟,試圖證明或反駁這些解決方案

4.強化學(xué)習:每找到并驗證一個(gè)證明,就用它來(lái)強化AlphaProof的語(yǔ)言模型,提高系統解決后續更具挑戰性問(wèn)題的能力

5.持續訓練:在準備IMO比賽期間,AlphaProof在數周內證明或反駁了數百萬(wàn)個(gè)問(wèn)題,覆蓋各種難度和數學(xué)主題。在比賽過(guò)程中,它還繼續應用這個(gè)訓練循環(huán),通過(guò)證明自己生成的比賽問(wèn)題變體來(lái)增強能力,直到找到完整解決方案

AlphaGeometry 2

AlphaGeometry 2是AlphaGeometry的改進(jìn)版本,它的語(yǔ)言模型基于Gemini,并在比前代多一個(gè)數量級的合成數據吉印通行了訓練

AlphaGeometry 2是一個(gè)神經(jīng)符號混合系統。主要改進(jìn)包括:

1.增強的語(yǔ)言模型:基于Gemini,從頭開(kāi)始訓練,使用了比前代多一個(gè)數量級的合成數據。這大大提高了模型處理復雜幾何問(wèn)題的能力,包括物體運動(dòng)、角度方程、比例或距離等問(wèn)題

2.更快的符號引擎:新版本的符號處理引擎速度提高了兩個(gè)數量級,大大加快了問(wèn)題解決速度

3.知識共享機制:引入了新的知識共享機制,能夠高級組合不同的搜索樹(shù),以解決更復雜的問(wèn)題

4.性能提升:在接受今年IMO比賽前,AlphaGeometry 2能夠解決過(guò)去25年IMO幾何問(wèn)題的83%,遠超前代系統53%的解決率

5.實(shí)時(shí)表現:在今年的IMO中,AlphaGeometry 2在接收到形式化的第4題后,僅用19秒就解決了這個(gè)問(wèn)題

6.DeepMind的研究團隊還在探索基于自然語(yǔ)言推理的系統,這種系統不需要將問(wèn)題轉換為形式化語(yǔ)言,可能與其他AI系統結合使用。這種方法在今年的IMO問(wèn)題上也顯示出了巨大的潛力

本文作者:AI寒武紀,來(lái)源:AI寒武紀,原文標題:《數學(xué)界的AlphaGo時(shí)刻:谷歌DeepMind AI 19秒解 IMO幾何題,僅差1分即可摘金牌》

風(fēng)險提示及免責條款

市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全