Google 的 DeepMind 團隊和 OpenAI 最近在數學領域取得了顯著成就,成功在 2025 年國際數學奧林匹克(IMO)中獲得金牌,擊敗了許多優秀的高中生。
IMO 2025 被認為是全球高中生展示數學才能的最艱難競賽之一。AI 模型的金牌得分標誌著 AI 技術的一個重大突破,顯示其不斷重新定義自身的極限。
關於奧林匹克
該奧林匹克賽事對全球學生開放,參賽者需解決一系列複雜的多步數學問題。學生在兩天內參加兩場四個半小時的考試。
挑戰包括解決共 6 道問題;2025 年的奧林匹克共有 630 名人類參賽者參加考試。要獲得金牌,學生需在 42 分中獲得 35 分。
來自 Google DeepMind 和 OpenAI 的模型成功解決了 6 道問題中的 5 道,達到獲得金牌的標準。還有 67 名學生也達成了這一成就,獲得金牌。
值得注意的細節
儘管這一成就值得讚賞,但兩家公司在此事件中的行為略顯尷尬。
IMO 邀請 Google 正式參加考試,但並未邀請 OpenAI。儘管如此,OpenAI 還是對問題進行了測試並聲稱獲得金牌。而 Google 則在競賽的官方結果出爐後,才通過博客發佈了這一成就。
有趣的是,OpenAI 在官方結果公布之前的周末就宣佈了他們的結果。IMO 曾要求 AI 公司在競賽結束前不要宣佈任何形式的結果,這使得情況變得更加尷尬。
Google 對 OpenAI 的「頑皮」行為進行了微妙的批評。
「我們尊重 IMO 委員會最初的要求,所有 AI 實驗室的結果應在官方結果經獨立專家驗證後,並在學生獲得應有的讚譽後再進行分享。」Google DeepMind CEO Demis Hassabis 在周一於 X 平台上表示。
驚人的事實
這一消息相當令人震驚。Google DeepMind 和 OpenAI 使用的模型並未對外公開,而公開可用的模型在此次測試中表現不佳。
研究人員通過 Gemini 2.5 Pro、Grok-4 和 OpenAI 04 測試問題,結果均未超過 13 分。
公眾和私有 AI 能力之間的差距驚人。消費者面向的聊天機器人仍在基本微積分上掙扎,而在幕後,先進的模型卻靜靜地解決著讓世界頂尖數學天才感到困惑的問題。
更引人注目的是,這些模型並非專門為數學而設計,而是通用系統,在其自身領域超越了專業模型。這一信息明確表明:我們或許不需要為每個任務設計不同的 AI。一個真正智能的系統或許很快就能處理所有任務。
日本電話卡推介 / 台灣電話卡推介
一㩒即做:香港網速測試 SpeedTest HK




