近日,在清華大學百川樓舉辦的“AI 醫療新範式”學術論壇上,百川智能創始人兼 CEO 王小川展示了即將發布的新一代醫療大模型 Baichuan-M4 與 AI 家庭醫生“百小醫”。王小川將醫療對大模型的剛性要求總結為三點:
首先,低幻覺:醫療容不得編造,一個錯誤的判斷可能危及生命。《BMJ Open》2026 年的研究系統評估了主流通用模型的醫療回答,約 50% 被評為“有問題”,近 20% 屬於“高度有問題”。通用模型目前的幻覺率在嚴肅的醫療場景下是不可接受的。
其次,強循證:臨牀診斷有嚴格的循證路徑,而不是“根據症狀猜一個最可能的病”。通用模型缺乏系統性的循證推理能力。《JAMA Network Open》2026 年評測了 21 款主流大模型在 29 個標準化臨牀案例中的表現,鑑別診斷階段的錯誤率普遍超過 80%——不按照指南邏輯層層排除,而是過早鎖定一個答案。
最後,會提問:任何受過訓練的醫生都不會在患者説完第一句話時就下結論。牛津大學 2026 年發表於《Nature Medicine》的研究揭示了一個關鍵差距:AI 讀取標準化病歷時準確率可達 94.9%,但真實患者自助使用時驟降至 34.5%。原因在於患者描述往往不完整,而通用模型不會像醫生一樣追問。
這三條剛需,通用模型一條都不達標。為此,百川在 M 系列醫療專用大模型進行了針對性的優化。根據 CNMO 科技瞭解,新一代醫療大模型 Baichuan-M4 在 HealthBench、HealthBench Hard、HealthBench Professional 三大權威醫療榜單中同時位列世界第一,超越 GPT-5.5、Opus 4.7、DeepSeek-V4-Pro 等模型。
依託原創的事實性感知強化學習算法,Baichuan-M4 將裸模型的事實性幻覺率降至 3.3%。
Baichuan-M4 將成為醫療大模型的新標杆
百小醫,百川即將發布的 AI 家庭醫生“百小醫”,產品核心定位是,“明明白白看醫生,安安心心管家人”。它將基於微信生態運作,在對話中捕捉並結構化每個人的身體狀態、用藥歷史和檢查數據,識別日常閒聊中的高危信號,主動提醒復診和用藥等行為。
📬 免費訂閱 TechRitual 科技精選
按「免費訂閱」即同意收到 TechRitual 嘅科技資訊及優惠。可隨時取消訂閱。

