Google 更新了用於評估 Android 應用程式開發 AI 模型的 Android Bench 排行榜,OpenAI 最新模型現與 Gemini 並列榜首。此基準測試於 3 月首次推出,是 Google 為開發者提供的資源,用以衡量最適合編寫 Android 應用程式的 AI 模型。Google 的評測方法涵蓋模型在 Jetpack Compose 用於 UI 設計、Coroutines 及 Flows 用於非同步程式設計、Room 用於資料持久化,以及 Hilt 用於依賴注入等方面的表現
等因素。 在本次首次更新中,Google 新增 OpenAI 的兩款模型 GPT 5.4 及 GPT 5.3 Codex,它們迅速竄升至榜首位置。
Google 認定的最佳 Android 應用程式開發 AI 模型
| 模型 | 分數 (%) |
|---|---|
| 新: GPT 5.4 | 72.4 |
| Gemini 3.1 Pro Preview | 72.4 |
| 新: GPT 5.3-Codex | 67.7 |
| Claude Opus 4.6 | 66.6 |
| GPT-5.2 Codex | 62.5 |
| Claude Opus 4.5 | 61.9 |
| Gemini 3 Pro Preview | 60.4 |
| Claude Sonnet 4.6 | 58.4 |
| Claude Sonnet 4.5 | 54.2 |
| Gemini 3 Flash Preview | 42 |
| Gemini 2.5 Flash | 16.1 |
其餘榜單未有變動,數據仍來自 2 月下旬的初始測試。OpenAI 的最新模型於 3 月中旬進行測試,本週公佈結果。當然,這些成績並非絕對事實。任何基準測試均存在局限,實際應用中表現往往因開發流程、成本及其他變數而異。Google 最初發佈此榜單的目標,是協助開發者提升生產力,並最終為 Android 生態系統帶來更高品質的應用程式。
AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們。




