Google 推出 Gemini 3.5 翻譯模型提升實時翻譯質素與語音生成能力

Google 近日宣佈，正式將基於 Gemini 3.5 打造的新一代翻譯模型全面引入 Google Translate 應用。新模型支持超過 70 種語言的實時翻譯，並在響應速度、語境理解以及語音還原等方面進行了大幅升級，進一步推動 AI 翻譯向接近真人同傳的方向發展。

Google 模型與此前採用的逐句翻譯模式不同，新模型引入了「連續實時生成」機制。系統會在翻譯速度與翻譯質量之間自動尋找平衡，在盡可能保留上下文語義的同時實現即時輸出。因此，翻譯後的語音與原始發言之間僅存在數秒延遲，整體體驗更接近實時同聲傳譯。

語言識別能力顯著提升

語言識別能力也是此次升級的重要亮點。過去用户需要提前選擇源語言和目標語言，而新模型能夠自動識別當前對話所使用的語言，並在多語言混合交流場景下持續完成翻譯任務。這意味著跨國會議、國際旅行以及多人交流等複雜環境下的使用體驗將進一步提升。

在語音生成方面，Gemini 3.5 翻譯模型不僅能夠完成內容轉換，還會盡可能保留原説話者的語調、語速、停頓以及情感表達，讓翻譯後的語音聽起來更加自然流暢，減少傳統機器翻譯的機械感。

與此同時，Google Translate 在交互方式上也進行了優化。此前用户使用語音翻譯功能時通常需要連接耳機，如今用户可直接將手機貼近耳邊收聽翻譯結果，整體操作方式更接近普通電話通話。

Google 還表示，未來將把這項技術擴展至 Google Meet 視頻會議平台，為跨語言會議、國際協作和遠程溝通提供支持。

想睇更深入嘅 AI 模型與工程科技報道？