阿里巴巴即將於除夕夜開源 Qwen 3.5 大模型 促進全球開發者參與

阿里巴巴旗下的通义千问團隊即將發佈新一代開源大模型 Qwen 3.5。目前該模型系列的相關代碼已提交至 Hugging Face 與 GitHub 倉庫,這標誌著這一備受期待的 AI 技術即將正式面向全球開發者開放。

Qwen 3.5 的技術進化

Qwen 3.5 在架構設計上實現了顯著進化。它採用了全新的混合注意力機制(Hybrid Attention),將線性注意力與標準注意力相結合,從而在保持強大推理能力的同時,大幅提升了長文本和複雜任務的處理效率。與前代模型相比,Qwen 3.5 是一款原生多模態模型。

它能夠直接理解並處理文本、圖像、音頻以及視頻數據,無需依賴外部插件或子模型進行轉換。 初步透露的模型規格包括 9B(90 億參數)指令微調版以及 35B-A3B(基於 MoE 架構)的中型版本,後者在數學推理與編程能力上表現尤為出色。當前的中國 AI 市場競爭已進入白熱化階段。除阿里外,DeepSeek 計劃推出其 V4 模型,字節跳動也在升級其豆包系列。行業分析人士認為,阿里選擇在除夕夜這一關鍵節點開源 Qwen 3.5,旨在通過技術領先地位獲取春節期間的流量峰值,並鞏固其在全球開源社區的影響力。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。