阿里巴巴即將於除夕夜開源 Qwen 3.5 大模型促進全球開發者參與

阿里巴巴旗下的通义千问團隊即將發佈新一代開源大模型 Qwen 3.5。目前該模型系列的相關代碼已提交至 Hugging Face 與 GitHub 倉庫，這標誌著這一備受期待的 AI 技術即將正式面向全球開發者開放。

Qwen 3.5 的技術進化

Qwen 3.5 在架構設計上實現了顯著進化。它採用了全新的混合注意力機制（Hybrid Attention），將線性注意力與標準注意力相結合，從而在保持強大推理能力的同時，大幅提升了長文本和複雜任務的處理效率。與前代模型相比，Qwen 3.5 是一款原生多模態模型。

它能夠直接理解並處理文本、圖像、音頻以及視頻數據，無需依賴外部插件或子模型進行轉換。初步透露的模型規格包括 9B（90 億參數）指令微調版以及 35B-A3B（基於 MoE 架構）的中型版本，後者在數學推理與編程能力上表現尤為出色。當前的中國 AI 市場競爭已進入白熱化階段。除阿里外，DeepSeek 計劃推出其 V4 模型，字節跳動也在升級其豆包系列。行業分析人士認為，阿里選擇在除夕夜這一關鍵節點開源 Qwen 3.5，旨在通過技術領先地位獲取春節期間的流量峰值，並鞏固其在全球開源社區的影響力。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

阿里巴巴即將於除夕夜開源 Qwen 3.5 大模型促進全球開發者參與

Qwen 3.5 的技術進化

Henderson

搜尋文章

Qwen 3.5 的技術進化

相關文章

Henderson

搜尋文章