Gemini Live 在 Android 和 iOS 上全面發佈,提升語音理解能力及互動表現

在八月與 Pixel 10 一同預覽後,Gemini Live 的原生音頻輸出現在已在 Android 和 iOS 平台全面上線。這一最新版本的 Gemini Live 利用重大模型更新,增強了對人類語音關鍵要素的理解和運用能力。因此,與 Gemini Live 的對話變得更加靈活和生動,為用戶提供了更豐富的互動體驗。

Gemini Live 的一大亮點是用戶可以控制其回答的速度。這項功能使得互動更加量身定制,用戶只需說「好,快點」即可快速獲取某主題的概述。這不僅提高了可及性,還使用戶能夠調整語音輸出到更舒適和易於理解的節奏。例如,學習者現在可以更有效地參與語言練習,請求 Gemini 給他們出題,像是用韓語的十的倍數或西班牙語的日常問候。

此外,Gemini Live 還展現了其有趣的一面,能夠使用不同的口音進行對話。用戶可以請求一個牛仔口音,來為以牛仔主題的生日派對構思甜品創意,或讓 Gemini 用倫敦 Cockney 口音來講述周日烤肉食譜。這種自定義的程度為學習和娛樂增添了趣味,使得用戶能夠體驗更身臨其境的故事講述方式。例如,用戶可以要求 Gemini 從尤利烏斯·凱薩的角度敘述羅馬帝國的歷史,並附上角色的口音,讓敘事不僅具啟發性,也充滿吸引力。

這些自定義設置旨在整個對話過程中持續存在。用戶可以通過訪問聊天記錄並點擊 Live 按鈕來回顧之前的設置。然而,重要的是要注意,所有自定義設置在開始新對話時會重置,確保每次互動都有全新的開始。最近的模型更新,可能與 Gemini 2.5 Flash Live API 的原生音頻相關,已在過去幾周逐步推出,標誌著 Gemini Live 功能的顯著提升。

除了其互動功能,Gemini Live 還致力於滿足不同用戶的需求,無論是教育應用還是輕鬆對話。語音的靈活性和多種口音的運用,不僅豐富了用戶體驗,也擴大了 Gemini Live 的實用範圍。這種多功能性對於語言學習者尤其有利,他們可以以更動態和有趣的方式練習技能,從而提高流利度。

此外,Gemini Live 對用戶體驗的重視反映了 Google 對於讓技術更具可及性和互動性的承諾。透過引入能夠實現個性化互動的功能,Google 旨在縮小人工智能與人類交流之間的差距。這一方法不僅提升了 Gemini Live 的功能性,也為未來的 AI 驅動對話工具的發展奠定了基礎。

隨著推廣的持續,用戶可以期待進一步的增強和功能,這將擴展 Gemini Live 的能力。人工智能在日常通信工具中的整合正變得越來越普遍,而 Gemini Live 則站在這一演變的前沿。憑藉其自適應特性和引人入勝的講故事能力,Gemini Live 不僅是一個信息檢索的工具,更是學習和創造的夥伴。

展望未來,Gemini Live 的前景令人鼓舞。隨著技術的不斷進步,更複雜的互動和功能潛力巨大。Google 可能會探索進一步增強用戶參與的途徑,或許通過在對話中整合更多的上下文理解甚至情感智能,這將進一步鞏固 Gemini Live 作為市場領先的對話 AI 工具的地位。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。