Gemini 3 Pro 與 ChatGPT 5.1 的性能比較分析

Google 最近發佈了其最先進的 Gemini 3 Pro 模型,聲稱能夠超越幾乎所有的前沿 AI 模型。因此,在這篇文章中,將 Gemini 3 Pro 與 OpenAI 最新的 ChatGPT 5.1 思考模型進行比較。我們針對 ChatGPT 使用了「延長」思考時間,以確保這兩個模型能在最佳狀態下表現。現在,讓我們來看看 Gemini 3 Pro 與 ChatGPT 5.1 思考之間的比較。

1. 測試邏輯推理

在比較 Gemini 3 Pro 與 ChatGPT 5.1 思考之前,我們從 SimpleBench 取了一個具有挑戰性的謎題(點擊這裡訪問)。在這次測試中,Gemini 3 Pro 和 ChatGPT 5.1 思考都正確地回答了問題,並表示約翰是那位禿頭的男人,發送短信是多餘的。

贏家:Gemini 3 Pro 和 ChatGPT 5.1 思考

2. 破解謎題

在下一個謎題中,我們觀察到了一些有趣的行為。Google 的 Gemini 3 Pro 很快解開了這個謎題,並表示房間 A 有四個完整的三明治,而房間 B 沒有完整的三明治。然而,ChatGPT 5.1 思考卻分析了超過四分鐘,並表示房間 A 有四個完整的三明治,而房間 B 有一個完整的三明治,這是錯誤的。

在這裡,我們看到 Gemini 3 Pro 擁有更卓越的推理能力,並明確擊敗了 ChatGPT 5.1 思考。需要注意的是,我們在 ChatGPT 上使用了延長思考時間,以便讓其有更多時間來思考問題,但 ChatGPT 還是無法得出正確答案。

贏家:Gemini 3 Pro

3. 幫我創建一個網站

AI 公司正在顯著改善其前端設計模型,因此我要求這兩個模型研究一下我並創建一個具有優雅設計的網站。Gemini 3 Pro 很快上網查詢了我的信息,並在幾秒鐘內生成了代碼。除了 HTML 和 CSS 文件外,它還創建了一個用於互動的 JavaScript 文件。

我渲染了這個網頁,外觀非常現代,但夜間模式與文本的結合效果不佳。另一方面,ChatGPT 5.1 思考則持續生成代碼超過四分鐘,但它也包含了很多我的工作細節,這非常棒。總體而言,這兩個 AI 模型在前端代碼生成方面都表現出色。

贏家:Gemini 3 Pro 和 ChatGPT 5.1 思考

4. 一隻鵜鶘騎自行車

我們運行了 Simon Willison 的經典基準測試——生成一個鵜鶘騎自行車的 SVG 來測試 Gemini 3 Pro 和 ChatGPT 5.1 思考的視覺推理。在這個奇特的測試中,Gemini 3 Pro 在描繪場景方面表現得比 ChatGPT 5.1 思考更好。其腿部位置在踏板區域,使得騎行的場景看起來更自然。

同時,在 ChatGPT 的輸出中,腿部似乎並未清晰顯示出在踏板上,姿勢看起來更像是與自行車框架合併在一起。依我看,Gemini 3 Pro 毫無疑問地贏得了這一輪。

贏家:Gemini 3 Pro

5. 創建一個旋轉的魔方

接下來,我要求 Gemini 3 Pro 和 ChatGPT 5.1 思考創建一個 3D 旋轉的魔方,顯示出極高的現實感。在這次測試中,Gemini 3 Pro 一次性成功生成了魔方,沒有任何錯誤。旋轉的魔方看起來非常現實,陰影隨著運動完美跟隨。

另一方面,ChatGPT 5.1 思考生成的代碼無法運行,僅顯示一個黑暗的背景。在我有限的測試中,Gemini 3 Pro 在代碼生成方面似乎比 ChatGPT 5.1 思考更出色。

贏家:Gemini 3 Pro

6. 臨床推理挑戰

AI 模型正在被測試和改善以用於醫療案例,因此我們認為應該在臨床推理問題上測試 Gemini 3 Pro 和 ChatGPT 5.1 思考。在這次測試中,Gemini 3 Pro 和 ChatGPT 5.1 思考都回答正確,表示 Spironolactone 是適合的利尿劑,考慮到經典的低鉀血症症狀。做得好,Google 和 OpenAI!

贏家:Gemini 3 Pro 和 ChatGPT 5.1 思考

Gemini 3 Pro vs ChatGPT 5.1:Google 破解了秘訣

回到 2024 年初,當我比較 Gemini 1.5 Pro 與 ChatGPT 4o 時,我發現 Google 的 AI 模型遠遠落後於 OpenAI 的先進模型。然而,隨著 2025 年 Gemini 2.5 Pro 的推出,Google 成功縮小了與 OpenAI 之間的差距。現在,在年底之前,Google 已證明其 Gemini 3 Pro 確實超越了許多前沿 AI 模型,包括 ChatGPT 5.1 思考。

過去幾年我一直在測試 AI 模型,這是我第一次真正享受使用 Google 的 Gemini 模型。Gemini 3 Pro 語言更加簡潔,直奔主題,完全理解我的需求,這是我只在 ChatGPT 上見過的。現在可以安全地說,Google 在 AI 競賽中已經領先,超越了 OpenAI。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。