阿里雲開源70億參數大語言模型持續投入促進開源社群發展

香港，2023年8月3日 — 阿里巴巴集團的數字技術與智能骨幹業務阿里雲宣佈，將兩款70億參數開源大語言模型Qwen-7B 及Qwen-7B-Chat，於其AI模型社區ModelScope及AI協作平台Hugging Face上架，以此為開源生態做出貢獻。

今年4月，阿里雲推出自研大語言模型通義千問。這一前沿的模型可生成類似於人類表達的中英文雙語內容，還包括70 億及以上參數量級不同的模型規模。此次阿里雲發布的開源版本包括預訓練的 70 億參數基座模型 Qwen-7B 和基於這一模型微調的對話模型 Qwen-7B-Chat。

為進一步助力AI技術普惠，全球學術、研究及商業機構均可免費獲取上述模型的代碼、模型權重和文檔。對於商業應用需求，月活躍用戶少於1 億的公司可免費使用模型，用户數超過該量級的企業可向阿里雲申請許可證。

阿里雲智能集團首席技術官周靖人表示：「透過開源自研的大語言模型，我們旨在促進技術普及，並令生成式AI惠及更多的開發者及中小企。阿里雲一直不遺餘力地推進不同的開源舉措，我們期待這一開放的模式能啟發更多集體智慧，並進一步促進開源社群的蓬勃發展。」

Qwen-7B 在超過 2 萬億token數據集上預訓練，涵蓋通用和專業領域的中英文及其他多語種資料、代碼和數學內容，上下文窗口長度達到 8千。在訓練過程中，Qwen-7B-Chat 模型已經與人類認知對齊。Qwen-7B和Qwen-7B-Chat模型均可部署在雲端及本地基礎設施上，便於用戶對模型微調，以高效、低成本的方式搭建適合自身使用的優質生成式AI模型。

Qwen-7B 預訓練模型於英文能力基準測評MMLU（大規模多任務語言理解）中表現突出，得分高達 56.7，超越一眾具有類似規模或更大規模的主流預訓練開源模型。這一測評旨在考驗文本模型在 57 個不同任務中處理多任務的準確性，涵蓋初等數學、計算機科學和法律等多個領域。在中文常識能力測試集C-Eval 上，Qwen-7B 同樣在同等參數模型中脫穎而出，在Leaderboard獲得最高分。該測評集涵蓋了人文、社會科學、STEM 等四大專業領域的 52 個學科。此外，Qwen-7B 在包括 GSM8K 和 HumanEval 等數學和代碼生成基準測評中亦表現出眾。

阿里雲的Qwen-7B模型於數個基準測評中均表現出眾

今年7月，阿里雲發佈了最新AI繪畫創作大模型「通義萬相」，旨在支持開發者和中小企業開展創新的圖像藝術表達。阿里雲亦於7月宣佈推出通用框架ModelScopeGPT，旨在協助用戶透過使用ModelScope平台上的多元AI模型完成各類極複雜和專業的AI任務，適用領域包括語言、視覺和語音等。ModelScope開源平台由阿里雲於去年推出，目前匯集由20家全球領先AI機構提供的1000多個AI開源模型。

如欲了解更多詳情，請瀏覽ModelScope 、HuggingFace及GitHub的Qwen-7B和 Qwen-7B-Chat模型網頁。

###

蘋果首次在印度降低 iPhone 價格，因應進口稅減少政策。

iPhone 市場份額在中國下降，但兩個因素可能會扭轉這一趨勢。

iPhone 17 可能加入無反光鏡相機功能以提升 Portrait 模式拍攝效果

honor X60i 所有顏色渲染圖洩漏

三星 Galaxy S25 Ultra 的電池容量可能令人失望

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 10天 15GB，關東+關西最快有 123Mbps 速度

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 6天 6GB，夠用得來速度都幾好

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 15天 10GB，真正即插即用好重要

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 13天 15GB，實試 iPhone Samsung 換卡即用唔駛設定

Pixel Buds Pro 2 洩漏顯示硬體升級及受 AirPods 啟發的設計變更

Meta AI 將為 Quest 3 提供個人助手功能

Oura Ring 4 洩漏顯示其計劃如何對抗 Samsung Galaxy Ring 的競爭

Google 可能計劃推出一款搭載 Gemini 的競爭對手，與 Ray-Ban Meta 智能眼鏡抗衡。

Google 試圖奪取 Meta 的 Ray-Ban 合作夥伴關係

【整理】如何在 Apple TV 安裝使用 VPN！

【詳解】VPN 是什麼？選擇、推薦及「免費」服務介紹 2024

【教學說明】如何在 iPhone (iOS 17) 上設定 VPN

【詳解】如何為 iPhone 選擇 VPN？私隱、無日誌政策、易用、速度，5 個 VPN 服務供應商推介

保護人工智慧：VPN在人工智慧系統安全中的作用

【開箱評價】Bodysonic 日系摺疊式靜音循環風扇 (6寸)：靜靜地涼風，枱頭最佳

【開箱評價】Bodysonic 電動冷凍迷你風扇：今個暑假，「掂」住就涼哂啦～！

【開箱評價】CMF Phone 1 手機：中低階但有組件元素勁吸引

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 10天 15GB，關東+關西最快有 123Mbps 速度

三星 S22 官方渲染圖流出！附新機規格表

阿里雲開源70億參數大語言模型持續投入促進開源社群發展

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 6天 6GB，夠用得來速度都幾好

【手機比較】小米 Mix Flip 與 Oppo Find N3 Flip：規格表、效能、攝影功能

什麼是打印機 (Printer)？5 大種類有咩分別？

【懶人包】HeatTECH 發熱衣 2019：原理，穿著技巧，注意事項

【開箱評價】HONOR X7b 5G 千元手機：1.08億像素可以，勝在夠抵！

【開箱評測】Honor Magic6 Pro 手機：有無線充啦！影相表現相當出眾

電話卡

比較系列

Stock

推薦內容

教學 101

關於我們

阿里雲開源70億參數大語言模型 持續投入促進開源社群發展

Stock

推薦內容

關於我們

阿里雲開源70億參數大語言模型持續投入促進開源社群發展