Google 更新 Android 應用程式開發 AI 模型排名　OpenAI GPT 5.4 與 Gemini 並列首位

Henderson
12/04/2026

Google 更新了用於評估 Android 應用程式開發 AI 模型的 Android Bench 排行榜，OpenAI 最新模型現與 Gemini 並列榜首。此基準測試於 3 月首次推出，是 Google 為開發者提供的資源，用以衡量最適合編寫 Android 應用程式的 AI 模型。Google 的評測方法涵蓋模型在 Jetpack Compose 用於 UI 設計、Coroutines 及 Flows 用於非同步程式設計、Room 用於資料持久化，以及 Hilt 用於依賴注入等方面的表現

等因素。在本次首次更新中，Google 新增 OpenAI 的兩款模型 GPT 5.4 及 GPT 5.3 Codex，它們迅速竄升至榜首位置。

Google 認定的最佳 Android 應用程式開發 AI 模型

模型	分數 (%)
新: GPT 5.4	72.4
Gemini 3.1 Pro Preview	72.4
新: GPT 5.3-Codex	67.7
Claude Opus 4.6	66.6
GPT-5.2 Codex	62.5
Claude Opus 4.5	61.9
Gemini 3 Pro Preview	60.4
Claude Sonnet 4.6	58.4
Claude Sonnet 4.5	54.2
Gemini 3 Flash Preview	42
Gemini 2.5 Flash	16.1

其餘榜單未有變動，數據仍來自 2 月下旬的初始測試。OpenAI 的最新模型於 3 月中旬進行測試，本週公佈結果。當然，這些成績並非絕對事實。任何基準測試均存在局限，實際應用中表現往往因開發流程、成本及其他變數而異。Google 最初發佈此榜單的目標，是協助開發者提升生產力，並最終為 Android 生態系統帶來更高品質的應用程式。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

Henderson

Henderson 是 TechRitual Hong Kong 科技編輯，專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來，累計撰寫數千篇科技報導及產品評測，內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。

友情網站：日本語版 / TechNippon The Base Principle（AI・工程）