Google 近日宣佈,正式將基於 Gemini 3.5 打造的新一代翻譯模型全面引入 Google Translate 應用。新模型支持超過 70 種語言的實時翻譯,並在響應速度、語境理解以及語音還原等方面進行了大幅升級,進一步推動 AI 翻譯向接近真人同傳的方向發展。
Google 模型與此前採用的逐句翻譯模式不同,新模型引入了「連續實時生成」機制。系統會在翻譯速度與翻譯質量之間自動尋找平衡,在盡可能保留上下文語義的同時實現即時輸出。因此,翻譯後的語音與原始發言之間僅存在數秒延遲,整體體驗更接近實時同聲傳譯。
語言識別能力顯著提升
語言識別能力也是此次升級的重要亮點。過去用户需要提前選擇源語言和目標語言,而新模型能夠自動識別當前對話所使用的語言,並在多語言混合交流場景下持續完成翻譯任務。這意味著跨國會議、國際旅行以及多人交流等複雜環境下的使用體驗將進一步提升。
在語音生成方面,Gemini 3.5 翻譯模型不僅能夠完成內容轉換,還會盡可能保留原説話者的語調、語速、停頓以及情感表達,讓翻譯後的語音聽起來更加自然流暢,減少傳統機器翻譯的機械感。
優化交互方式及未來展望
與此同時,Google Translate 在交互方式上也進行了優化。此前用户使用語音翻譯功能時通常需要連接耳機,如今用户可直接將手機貼近耳邊收聽翻譯結果,整體操作方式更接近普通電話通話。
Google 還表示,未來將把這項技術擴展至 Google Meet 視頻會議平台,為跨語言會議、國際協作和遠程溝通提供支持。

