OpenAI 最近推出了 Sora 2,這是一款升級版的視音頻生成模型,並伴隨著一個全新的 iOS 社交應用程式,同樣名為 Sora。這款應用程式在 TikTok 的短視頻格式上進行了深度借鑒,並增加了一些新功能:用戶可以錄製短片,然後讓朋友將這些片段轉換成 AI 生成的角色出現。這一創新不僅提升了社交互動的趣味性,也為用戶提供了一個全新的創作平台。
Sora 的首次發布是在 2024 年 2 月,OpenAI 將其形容為視頻領域的 GPT-1 事件,這一模型展示了大規模視頻訓練所能解鎖的潛力。而 Sora 2 則被視為 GPT-3.5 時刻,具有更先進的世界模擬和可控性。不過,這一更新也引發了人們對於互聯網上 AI 生成內容的質量和道德問題的深入思考。以前的視頻模型在滿足提示時經常使用不自然的手法,例如物體瞬間移動或形狀變化,而 OpenAI 宣稱 Sora 2 在這方面有了顯著改善。
例如,當籃球投籃失誤時,球會從籃板彈回,而不是神奇地掉進籃框。系統還引入了自然的失誤,例如體操運動員的失誤,讓場景更接近現實。此外,Sora 2 在不同鏡頭間保持連貫性方面也有提升,能夠根據詳細指示生成一致的內容。該模型的風格範圍涵蓋了電影風格和動漫,並生成相應的音效和對話,使得生成的視頻更加生動和真實。
Sora 應用的核心功能是「角色出現」,用戶可以錄製一段短片和聲音樣本,然後朋友可以將這些片段放入 AI 生成的場景中。每個人可以控制誰可以使用他們的肖像,並可以隨時撤回或刪除任何角色出現視頻。在內部測試中,OpenAI 的員工表示,這一功能有助於他們與同事建立聯繫。然而,在公開推出時,該應用的使用範圍僅限於美國和加拿大的邀請制用戶,初始時短片長度限制為 10 秒,用戶可以在自己的動態中重新編輯視頻。
Sora 的設計強調了同意和內容管理的優先性。公眾人物必須上傳自己的角色出現並明確授權才能出現在視頻中。同時,青少年用戶的設置會更加嚴格,並且每日動態的使用時間會受到限制,家長還可以通過 ChatGPT 家長控制來調整滾動、個性化和直接消息功能。儘管 OpenAI 宣稱生成極端或不雅內容是「不可能」的,但隨著平台的擴大,內容管理的挑戰往往會出現。儘管公司承諾不會優化無盡的參與度,但懷疑者注意到在社交媒體歷史中,類似的承諾經常會失敗。
目前,Sora 2 是免費的,並設有使用限制,而 ChatGPT Pro 訂閱用戶則可以在 sora.com 獲得更高端的版本。整體而言,視頻生成技術正在以驚人的速度進步,但隨之而來的問題是,當任何人都可以將自己或他人放入 AI 生成的現實中時,將會發生什麼。這一切將如何發展,值得持續關注。




