百川智能推出新一代醫療大模型 Baichuan-M4 幻覺率降至 3.3%

近日，在清華大學百川樓舉辦的“AI 醫療新範式”學術論壇上，百川智能創始人兼 CEO 王小川展示了即將發布的新一代醫療大模型 Baichuan-M4 與 AI 家庭醫生“百小醫”。王小川將醫療對大模型的剛性要求總結為三點：

首先，低幻覺：醫療容不得編造，一個錯誤的判斷可能危及生命。《BMJ Open》2026 年的研究系統評估了主流通用模型的醫療回答，約 50% 被評為“有問題”，近 20% 屬於“高度有問題”。通用模型目前的幻覺率在嚴肅的醫療場景下是不可接受的。

其次，強循證：臨牀診斷有嚴格的循證路徑，而不是“根據症狀猜一個最可能的病”。通用模型缺乏系統性的循證推理能力。《JAMA Network Open》2026 年評測了 21 款主流大模型在 29 個標準化臨牀案例中的表現，鑑別診斷階段的錯誤率普遍超過 80%——不按照指南邏輯層層排除，而是過早鎖定一個答案。

最後，會提問：任何受過訓練的醫生都不會在患者説完第一句話時就下結論。牛津大學 2026 年發表於《Nature Medicine》的研究揭示了一個關鍵差距：AI 讀取標準化病歷時準確率可達 94.9%，但真實患者自助使用時驟降至 34.5%。原因在於患者描述往往不完整，而通用模型不會像醫生一樣追問。

這三條剛需，通用模型一條都不達標。為此，百川在 M 系列醫療專用大模型進行了針對性的優化。根據 CNMO 科技瞭解，新一代醫療大模型 Baichuan-M4 在 HealthBench、HealthBench Hard、HealthBench Professional 三大權威醫療榜單中同時位列世界第一，超越 GPT-5.5、Opus 4.7、DeepSeek-V4-Pro 等模型。

依託原創的事實性感知強化學習算法，Baichuan-M4 將裸模型的事實性幻覺率降至 3.3%。

Baichuan-M4 將成為醫療大模型的新標杆

百小醫，百川即將發布的 AI 家庭醫生“百小醫”，產品核心定位是，“明明白白看醫生，安安心心管家人”。它將基於微信生態運作，在對話中捕捉並結構化每個人的身體狀態、用藥歷史和檢查數據，識別日常閒聊中的高危信號，主動提醒復診和用藥等行為。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

百川智能推出新一代醫療大模型 Baichuan-M4 幻覺率降至 3.3%

Baichuan-M4 將成為醫療大模型的新標杆

Henderson

搜尋文章