YouTube 生態將有大變?廣東話都有出頭天?因為 Google 可能推出即時翻譯功能

在 Google I/O 2023 活動中,無縫地整合 PaLM 2 的人工智能功能到 Google 生態系統中,包括 Bard,一直是主要主題。儘管 Google 認為有一些功能不應立即發布。在 Google I/O 的主題演講中,公司的技術和社會高級副總裁詹姆斯·曼尼卡(James Manyika)提出了有關錯誤信息和某些人工智能能力之間潛在緊張關係的擔憂,即深度偽造背後的技術。他所指的是深度偽造使用的語言模型,用於在視頻中配音。

您知道那些,其中一位著名演員在最佳電視節目或最佳電影中的獨白突然被換成了口型同步。因此,Google 正在採取一些措施,以建立所謂的「防護欄」,以防止一些新功能被誤用,例如在照片和視頻中留下水印和元數據。Google 正在向一組合作夥伴推出的一種新工具是一個原型,稱為「通用翻譯器」,這將是非常有用和有益的,但很容易被誤用。

Google 的通用翻譯器是一種實驗性的人工智能視頻配音服務,可以實時翻譯語音,讓您在觀看視頻時立即閱讀他人用另一種語言說的話。原型在活動中展示,展示了一個測試的視頻,該視頻是與亞利桑那州立大學合作創建的在線大學課程的一部分。

該模型分為四個階段。在第一階段,模型將視頻中的口型動作與其識別的詞匹配。第二步觸發一個算法,提供即時語音生成。模型的第三階段使用語調,測量說話者自然節奏的升降,以幫助翻譯。最後,一旦它從說話者的口型動作中複製了風格並匹配了音調,它就會將所有這些結合在一起生成翻譯。Google 表示,早期結果令人鼓舞。研究中的大學生顯示出更高的課程完成率。

通用翻譯器功能將在哪裡使用?儘管通用翻譯器功能尚未在小型測試組之外提供,但一旦 Google 測試了多種安全措施,它可能會將其推出到 YouTube 等服務以及其視頻會議服務 Google Meet 中。毕竟,能够實時將視頻翻譯為多種語言可能是一種非常有用的工具。

通用翻譯器不僅可以擴大 YouTube 頻道的全球觀眾,還可以允許跨國家進行更多的協作項目。我們一定會密切關注並等待更多關於此功能以及它在 Google 生態系統中的應用的信息。如果您想了解更多關於 Google I/O 的最大新聞,請查看我們的 Google I/O 2023 現場博客,以獲得事件公佈的詳細信息。

Sourcetechradar
此文章發佈於 TechRitual 香港