Google 發佈 Gemini 3.5 Flash AI 模型轉型為自主執行工具

Google 在週二推出了 Gemini 3.5 Flash，這是一個全新的人工智能模型，該公司表示這是其目前最強大的編碼和自主人工智能代理模型。該模型在公司年度的 Google I/O 開發者大會上介紹，能夠獨立執行編碼流程、管理研究項目，並在內部測試中完全從零開始構建操作系統。這一發布標誌著 Google 從將人工智能定位為對話工具轉向將其視為代理工具的轉變。

它不僅僅是回答問題，而是能夠規劃、構建和不斷迭代實際工作，且人類的介入極少。

DeepMind 首席技術官 Koray Kavukcuoglu 在公開發布前的記者會上表示：“3.5 Flash 提供了質量與低延遲的驚人結合。在幾乎所有基準測試中，它的表現均優於我們最新的前沿模型 3.1 Pro，包括編碼、代理任務和多模態推理。”他補充道，該模型的速度比其他前沿模型快四倍，這一速度非常適合編碼和代理任務，但 Google “將其提升到另一個層次”，開發了經過優化版本的 Flash，速度快十二倍且質量不變。

Kavukcuoglu 表示，這一速度對於代理工作至關重要，因為多個人工智能代理能夠同時在長期任務上運行。

Gemini 3.5 Flash 的代理能力顯著提升

在 I/O 大會上，Google 工程師 Varun Mohan 演示了代理如何分開工作於不同組件，然後再聚集起來在公司的代理開發平台和 IDE Antigravity 中構建完整的操作系統。Kavukcuoglu 指出，Flash 3.5 是與 Antigravity 共同開發的，使代理能夠在“本地環境中生活、工作和執行”。在 I/O 大會上，Google 還發布了 Antigravity 2.0，這是一款圍繞代理優先開發設計的獨立桌面應用程序。

這些進展已經超出了演示效果。Google 表示，3.5 Flash 的代理能力已經在合作夥伴中產生了影響，例如銀行和金融科技公司自動化多週的工作流程，或數據科學團隊在複雜數據環境中發現見解。該模型能夠自動運行多個小時，雖然 Google 高級總監兼產品負責人 Tulsee Doshi 表示，當其遇到需要人類判斷的決策點或許可問題時，會暫停並要求用户輸入。

當 Google 發布即將推出的 3.5 Pro 模型時，這兩者將設計為協同工作。Doshi 對 TechCrunch 表示：“3.5 Pro 成為您的協調者、規劃者，然後它實際上可以利用 Flash 來作為各種子代理。我認為這真的取決於您想要在哪裡擁有推理能力，在哪裡希望那個更大的模型能夠在推理方面真正發揮作用，以及在哪裡您有那些真正需要良好的強力工具使用能力的任務？

”

目前，3.5 Flash 是 Gemini 應用程式和全球搜索的人工智能模式中的默認模型。在 I/O 大會上，Google 還宣佈，代理能力將進入搜索，讓用户能夠在平台上直接創建、自定義和管理人工智能代理。這一新模型還將驅動 Gemini Spark，Google 新推出的個人人工智能代理，旨在 24/7 運行，幫助消費者管理其數位生活。

為普通消費者提供這一級別的人工智能能力引發了監察。Google 目前面臨訴訟，因為一名男子在與 Gemini 聊天數週後，幾乎造成大規模傷亡事件並自殺。隨著更強大的自主代理的廣泛可用，潛在的危害問題愈加嚴重。Google 表示，Gemini 3.5 加強了網絡和化學、生物、放射和核（CBRN）安全防護，並更好地調整了與敏感問題的互動，而不是直接拒絕。

Gemini 3.5 Flash 現在通過 Antigravity、Gemini API 和 Gemini Enterprise 以及 Gemini 應用程式和搜索中的人工智能模式普遍可用。

項目	規格
模型版本	Gemini 3.5 Flash
速度	12x 快於其他前沿模型
運行時間	可自主運行多小時

Google 發佈 Gemini 3.5 Flash AI 模型轉型為自主執行工具

Gemini 3.5 Flash 的代理能力顯著提升

Henderson

搜尋文章