Google 在週二推出了 Gemini 3.5 Flash,這是一個全新的人工智能模型,該公司表示這是其目前最強大的編碼和自主人工智能代理模型。該模型在公司年度的 Google I/O 開發者大會上介紹,能夠獨立執行編碼流程、管理研究項目,並在內部測試中完全從零開始構建操作系統。這一發布標誌著 Google 從將人工智能定位為對話工具轉向將其視為代理工具的轉變。
它不僅僅是回答問題,而是能夠規劃、構建和不斷迭代實際工作,且人類的介入極少。
DeepMind 首席技術官 Koray Kavukcuoglu 在公開發布前的記者會上表示:“3.5 Flash 提供了質量與低延遲的驚人結合。在幾乎所有基準測試中,它的表現均優於我們最新的前沿模型 3.1 Pro,包括編碼、代理任務和多模態推理。”他補充道,該模型的速度比其他前沿模型快四倍,這一速度非常適合編碼和代理任務,但 Google “將其提升到另一個層次”,開發了經過優化版本的 Flash,速度快十二倍且質量不變。
Kavukcuoglu 表示,這一速度對於代理工作至關重要,因為多個人工智能代理能夠同時在長期任務上運行。
Gemini 3.5 Flash 的代理能力顯著提升
在 I/O 大會上,Google 工程師 Varun Mohan 演示了代理如何分開工作於不同組件,然後再聚集起來在公司的代理開發平台和 IDE Antigravity 中構建完整的操作系統。Kavukcuoglu 指出,Flash 3.5 是與 Antigravity 共同開發的,使代理能夠在“本地環境中生活、工作和執行”。在 I/O 大會上,Google 還發布了 Antigravity 2.0,這是一款圍繞代理優先開發設計的獨立桌面應用程序。
這些進展已經超出了演示效果。Google 表示,3.5 Flash 的代理能力已經在合作夥伴中產生了影響,例如銀行和金融科技公司自動化多週的工作流程,或數據科學團隊在複雜數據環境中發現見解。該模型能夠自動運行多個小時,雖然 Google 高級總監兼產品負責人 Tulsee Doshi 表示,當其遇到需要人類判斷的決策點或許可問題時,會暫停並要求用户輸入。
當 Google 發布即將推出的 3.5 Pro 模型時,這兩者將設計為協同工作。Doshi 對 TechCrunch 表示:“3.5 Pro 成為您的協調者、規劃者,然後它實際上可以利用 Flash 來作為各種子代理。我認為這真的取決於您想要在哪裡擁有推理能力,在哪裡希望那個更大的模型能夠在推理方面真正發揮作用,以及在哪裡您有那些真正需要良好的強力工具使用能力的任務?
”
目前,3.5 Flash 是 Gemini 應用程式和全球搜索的人工智能模式中的默認模型。在 I/O 大會上,Google 還宣佈,代理能力將進入搜索,讓用户能夠在平台上直接創建、自定義和管理人工智能代理。這一新模型還將驅動 Gemini Spark,Google 新推出的個人人工智能代理,旨在 24/7 運行,幫助消費者管理其數位生活。
為普通消費者提供這一級別的人工智能能力引發了監察。Google 目前面臨訴訟,因為一名男子在與 Gemini 聊天數週後,幾乎造成大規模傷亡事件並自殺。隨著更強大的自主代理的廣泛可用,潛在的危害問題愈加嚴重。Google 表示,Gemini 3.5 加強了網絡和化學、生物、放射和核(CBRN)安全防護,並更好地調整了與敏感問題的互動,而不是直接拒絕。
Gemini 3.5 Flash 現在通過 Antigravity、Gemini API 和 Gemini Enterprise 以及 Gemini 應用程式和搜索中的人工智能模式普遍可用。
項目 規格 模型版本 Gemini 3.5 Flash 速度 12x 快於其他前沿模型 運行時間 可自主運行多小時

