韓國 Naver 發佈自研視覺編碼器全數取代阿里 Qwen

Naver Cloud 宣布將全面移除其 AI 模型中使用的中國阿里雲 Qwen 2.5 視覺編碼器，並全盤換上自家研發的視覺編碼器。Naver Cloud 已於上月完成自家視覺編碼器的開發，並啟動優化工作，計劃將其全面應用於未來所有多模態模型。

韓國政府審查引發爭議

Naver 表示，新編碼器基於 Naver 原有技術「VUClip」大幅改進，性能已達與全球頂級模型 Qwen 相當時的水準。視覺編碼器是多模態 AI 中將圖像與視頻資訊轉換為可理解數值格式的模塊，被稱為模型的「視覺神經」。年初，Naver 在參與韓國政府主導的獨立 AI 基礎模型項目時，其 HyperCLOVA X SEED 32B Sync 模型部分使用阿里 Qwen 2.5 的視覺編碼器而引發爭議。1 月 15 日，韓國科學技術資訊通信部公布首輪評審結果，Naver Cloud 模型原創性與技術獨立性不足被直接淘汰，與之一同被淘汰的還有 NC AI。當時 Naver 辯稱「視覺編碼器可隨時更換，並非不可取代的核心部件」。四個月後，Naver 推出新編碼器，其最大亮點在於從訓練階段即以韓語為中心設計，將圖像與韓語直接連接，無需經過中間翻譯層。

Naver Cloud 相關負責人強調，在處理包含韓國地名、文化或專有名詞的視覺數據時，新編碼器可避免資訊在翻譯過程中產生失真情況。不過，此前已開源發佈的 HyperCLOVA X SEED 32B Sync 模型的編碼器替換計劃尚未確定。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

韓國 Naver 發佈自研視覺編碼器全數取代阿里 Qwen

韓國政府審查引發爭議

Henderson

搜尋文章

韓國政府審查引發爭議

相關文章

Henderson

搜尋文章