韓國 Naver 發佈自研視覺編碼器 全數取代阿里 Qwen

Naver Cloud 宣布將全面移除其 AI 模型中使用的中國阿里雲 Qwen 2.5 視覺編碼器,並全盤換上自家研發的視覺編碼器。Naver Cloud 已於上月完成自家視覺編碼器的開發,並啟動優化工作,計劃將其全面應用於未來所有多模態模型。

韓國政府審查引發爭議

Naver 表示,新編碼器基於 Naver 原有技術「VUClip」大幅改進,性能已達與全球頂級模型 Qwen 相當時的水準。視覺編碼器是多模態 AI 中將圖像與視頻資訊轉換為可理解數值格式的模塊,被稱為模型的「視覺神經」。 年初,Naver 在參與韓國政府主導的獨立 AI 基礎模型項目時,其 HyperCLOVA X SEED 32B Sync 模型部分使用阿里 Qwen 2.

5 的視覺編碼器而引發爭議。1 月 15 日,韓國科學技術資訊通信部公布首輪評審結果,Naver Cloud 模型原創性與技術獨立性不足被直接淘汰,與之一同被淘汰的還有 NC AI。 當時 Naver 辯稱「視覺編碼器可隨時更換,並非不可取代的核心部件」。四個月後,Naver 推出新編碼器,其最大亮點在於從訓練階段即以韓語為中心設計,將圖像與韓語直接連接,無需經過中間翻譯層。

Naver Cloud 相關負責人強調,在處理包含韓國地名、文化或專有名詞的視覺數據時,新編碼器可避免資訊在翻譯過程中產生失真情況。不過,此前已開源發佈的 HyperCLOVA X SEED 32B Sync 模型的編碼器替換計劃尚未確定。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。