AI 模型在國際數學奧林匹克中超越高中數學精英

Google 的 DeepMind 團隊和 OpenAI 最近在數學領域取得了顯著成就，成功在 2025 年國際數學奧林匹克（IMO）中獲得金牌，擊敗了許多優秀的高中生。

IMO 2025 被認為是全球高中生展示數學才能的最艱難競賽之一。AI 模型的金牌得分標誌著 AI 技術的一個重大突破，顯示其不斷重新定義自身的極限。

關於奧林匹克
該奧林匹克賽事對全球學生開放，參賽者需解決一系列複雜的多步數學問題。學生在兩天內參加兩場四個半小時的考試。

挑戰包括解決共 6 道問題；2025 年的奧林匹克共有 630 名人類參賽者參加考試。要獲得金牌，學生需在 42 分中獲得 35 分。

來自 Google DeepMind 和 OpenAI 的模型成功解決了 6 道問題中的 5 道，達到獲得金牌的標準。還有 67 名學生也達成了這一成就，獲得金牌。

值得注意的細節
儘管這一成就值得讚賞，但兩家公司在此事件中的行為略顯尷尬。

IMO 邀請 Google 正式參加考試，但並未邀請 OpenAI。儘管如此，OpenAI 還是對問題進行了測試並聲稱獲得金牌。而 Google 則在競賽的官方結果出爐後，才通過博客發佈了這一成就。

有趣的是，OpenAI 在官方結果公布之前的周末就宣佈了他們的結果。IMO 曾要求 AI 公司在競賽結束前不要宣佈任何形式的結果，這使得情況變得更加尷尬。

Google 對 OpenAI 的「頑皮」行為進行了微妙的批評。

「我們尊重 IMO 委員會最初的要求，所有 AI 實驗室的結果應在官方結果經獨立專家驗證後，並在學生獲得應有的讚譽後再進行分享。」Google DeepMind CEO Demis Hassabis 在周一於 X 平台上表示。

驚人的事實
這一消息相當令人震驚。Google DeepMind 和 OpenAI 使用的模型並未對外公開，而公開可用的模型在此次測試中表現不佳。

研究人員通過 Gemini 2.5 Pro、Grok-4 和 OpenAI 04 測試問題，結果均未超過 13 分。

公眾和私有 AI 能力之間的差距驚人。消費者面向的聊天機器人仍在基本微積分上掙扎，而在幕後，先進的模型卻靜靜地解決著讓世界頂尖數學天才感到困惑的問題。

更引人注目的是，這些模型並非專門為數學而設計，而是通用系統，在其自身領域超越了專業模型。這一信息明確表明：我們或許不需要為每個任務設計不同的 AI。一個真正智能的系統或許很快就能處理所有任務。

日本電話卡推介 / 台灣電話卡推介
一㩒即做：香港網速測試 SpeedTest HK

想睇更深入嘅 AI 模型與工程科技報道？

搜尋文章