Google 更新 Android 應用程式開發 AI 模型排名 OpenAI GPT 5.4 與 Gemini 並列首位

Google 更新了用於評估 Android 應用程式開發 AI 模型的 Android Bench 排行榜,OpenAI 最新模型現與 Gemini 並列榜首。此基準測試於 3 月首次推出,是 Google 為開發者提供的資源,用以衡量最適合編寫 Android 應用程式的 AI 模型。Google 的評測方法涵蓋模型在 Jetpack Compose 用於 UI 設計、Coroutines 及 Flows 用於非同步程式設計、Room 用於資料持久化,以及 Hilt 用於依賴注入等方面的表現

等因素。 在本次首次更新中,Google 新增 OpenAI 的兩款模型 GPT 5.4 及 GPT 5.3 Codex,它們迅速竄升至榜首位置。

Google 認定的最佳 Android 應用程式開發 AI 模型

模型分數 (%)
新: GPT 5.472.4
Gemini 3.1 Pro Preview72.4
新: GPT 5.3-Codex67.7
Claude Opus 4.666.6
GPT-5.2 Codex62.5
Claude Opus 4.561.9
Gemini 3 Pro Preview60.4
Claude Sonnet 4.658.4
Claude Sonnet 4.554.2
Gemini 3 Flash Preview42
Gemini 2.5 Flash16.1

其餘榜單未有變動,數據仍來自 2 月下旬的初始測試。OpenAI 的最新模型於 3 月中旬進行測試,本週公佈結果。當然,這些成績並非絕對事實。任何基準測試均存在局限,實際應用中表現往往因開發流程、成本及其他變數而異。Google 最初發佈此榜單的目標,是協助開發者提升生產力,並最終為 Android 生態系統帶來更高品質的應用程式。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。