在八月與 Pixel 10 一同預覽後,Gemini Live 的原生音頻輸出現在已在 Android 和 iOS 平台全面上線。這一最新版本的 Gemini Live 利用重大模型更新,增強了對人類語音關鍵要素的理解和運用能力。因此,與 Gemini Live 的對話變得更加靈活和生動,為用戶提供了更豐富的互動體驗。
Gemini Live 的一大亮點是用戶可以控制其回答的速度。這項功能使得互動更加量身定制,用戶只需說「好,快點」即可快速獲取某主題的概述。這不僅提高了可及性,還使用戶能夠調整語音輸出到更舒適和易於理解的節奏。例如,學習者現在可以更有效地參與語言練習,請求 Gemini 給他們出題,像是用韓語的十的倍數或西班牙語的日常問候。
此外,Gemini Live 還展現了其有趣的一面,能夠使用不同的口音進行對話。用戶可以請求一個牛仔口音,來為以牛仔主題的生日派對構思甜品創意,或讓 Gemini 用倫敦 Cockney 口音來講述周日烤肉食譜。這種自定義的程度為學習和娛樂增添了趣味,使得用戶能夠體驗更身臨其境的故事講述方式。例如,用戶可以要求 Gemini 從尤利烏斯·凱薩的角度敘述羅馬帝國的歷史,並附上角色的口音,讓敘事不僅具啟發性,也充滿吸引力。
這些自定義設置旨在整個對話過程中持續存在。用戶可以通過訪問聊天記錄並點擊 Live 按鈕來回顧之前的設置。然而,重要的是要注意,所有自定義設置在開始新對話時會重置,確保每次互動都有全新的開始。最近的模型更新,可能與 Gemini 2.5 Flash Live API 的原生音頻相關,已在過去幾周逐步推出,標誌著 Gemini Live 功能的顯著提升。
除了其互動功能,Gemini Live 還致力於滿足不同用戶的需求,無論是教育應用還是輕鬆對話。語音的靈活性和多種口音的運用,不僅豐富了用戶體驗,也擴大了 Gemini Live 的實用範圍。這種多功能性對於語言學習者尤其有利,他們可以以更動態和有趣的方式練習技能,從而提高流利度。
此外,Gemini Live 對用戶體驗的重視反映了 Google 對於讓技術更具可及性和互動性的承諾。透過引入能夠實現個性化互動的功能,Google 旨在縮小人工智能與人類交流之間的差距。這一方法不僅提升了 Gemini Live 的功能性,也為未來的 AI 驅動對話工具的發展奠定了基礎。
隨著推廣的持續,用戶可以期待進一步的增強和功能,這將擴展 Gemini Live 的能力。人工智能在日常通信工具中的整合正變得越來越普遍,而 Gemini Live 則站在這一演變的前沿。憑藉其自適應特性和引人入勝的講故事能力,Gemini Live 不僅是一個信息檢索的工具,更是學習和創造的夥伴。
展望未來,Gemini Live 的前景令人鼓舞。隨著技術的不斷進步,更複雜的互動和功能潛力巨大。Google 可能會探索進一步增強用戶參與的途徑,或許通過在對話中整合更多的上下文理解甚至情感智能,這將進一步鞏固 Gemini Live 作為市場領先的對話 AI 工具的地位。




