Google 發布升級版 Gemini 2.5 Pro 預覽版,性能進一步提升

Google 今日發布了升級版的 Gemini 2.5 Pro 預覽版,預計將在未來幾周內正式推出。

此次模型更新基於上個月的 2.5 Pro I/O 版本(05-06),該版本帶來了編碼升級。今日的 06-05 版本在 AIDER Polyglot 等基準測試中繼續展現出色表現,同時在 GPQA 和 Humanity’s Last Exam (HLE) 這些高度挑戰性的基準測試中也顯示了頂級性能,這些測試評估模型的數學、科學、知識和推理能力。

此外,Google 指出,今日的 06-05 在 LMArena 上的 Elo 分數上升了 24 分,目前為 1470,同時在 WebDevArena 上的 Elo 分數也上升了 35 分,達到 1443。

隨著上次模型升級,使用者注意到在編碼以外的性能有所下降。Google 現在正在針對這一反饋進行改進,優化了“風格和結構”,使得 Gemini 2.5 Pro 能夠提供更具創意和格式更佳的回應。

目前,Gemini 2.5 Pro 模型更新仍處於預覽階段,預期在幾周內將正式對外發布。該更新目前已在 Google AI Studio 和 Vertex AI 的 Gemini API 上線,開發者可以通過思考預算來控制成本和延遲。Gemini 應用程式也同時獲得了這一 2.5 Pro 升級。

同場加映:香港無痛,不用 VPN 情況下使用 Google Gemini

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【整理】Google Gemini 語音指令:發 WhatsApp、開 Apps、打電話等等

十斗
十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。