OpenAI 發佈 Sora 2 視頻模型,提升真實感與音效效果

距離 OpenAI 宣佈 Sora——其視頻和音頻生成模型,已經過了一年多的時間。現在,OpenAI 正式推出 Sora 2,這是其首個重大更新,能夠生成更真實且物理上更準確的視頻,並改善用戶控制和編輯功能。

Sora 2 被形容為一個「GPT 3.5 時刻」,同時也帶來了改進的音效輸出,實現了對話和音效的同步。Sora 2 能夠避免以往視頻生成模型常見的問題,例如物體變形和扭曲物理現實以完成提示。

生成的視頻將遵循多鏡頭指令,並在不同場景中保持一致性。Sora 2 支持多種視頻生成風格,包括電影風格、現實主義和動畫。

OpenAI 還推出了一款獨立的 Sora iOS 應用,採用邀請制系統。Sora 2 設有多項安全措施,包括對公共人物在視頻生成中的使用進行限制。OpenAI 還確認,用戶可以授權其他人使用其肖像創建「客串」,但未來任何時候都可以撤回該授權。

Sora 2 的初步推出今天開始,將限於美國和加拿大。至於定價,OpenAI 確認 Sora 2 的初期將免費,並設有「慷慨的限制」,以便用戶探索其功能。

ChatGPT Pro 訂閱用戶將獲得更高品質的 Sora 2 Pro 模型。OpenAI 也確認將很快釋放 Sora 2 的 API。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。