【CNMO科技动静】近日,于清华年夜学百川楼举办的“AI医疗新范式”学术论坛上,百川智能开创人兼CEO王小川展示了行将发布的新一代医疗年夜模子Baichuan-M4与AI家庭大夫“百小医”。

王小川将医疗对于年夜模子的刚性要求总结为三点:
低幻觉:医疗容不患上编造,一个过错判定可能危和生命。《BMJ Open》2026年的研究体系评估了主畅通用模子的医疗回覆,约50%被评为“有问题”,近20%属在“高度有问题”。通用模子当前的幻觉率于严厉医疗场景下不成接管。
强循证:临床诊断有严酷的循证路径,不是“按照症状猜一个最可能的病”。通用模子缺少体系性的循证推理能力。《JAMA Network Open》2026年评测了21款主流年夜模子于29个尺度化临床案例中的体现,辨别诊断阶段的过错率遍及跨越 80%——不按指南逻辑层层解除,而是过早锁定一个谜底。
会发问:任何受过练习的大夫都不会于患者说完第一句话时就下结论。牛津年夜学2026年发表在《Nature Medicine》的研究展现了一个要害差距:AI读尺度化病用时正确率可达94.9%,但真实患者自助利用时骤降至34.5%。缘故原由于在患者描写往往不完备,而通用模子不会像大夫同样追问。
三条刚需,通用模子一条都不达标。为此,百川于M系列医疗专用年夜模子做了针对于性的优化。
据CNMO科技相识,新一代医疗年夜模子Baichuan-M4,于HealthBench、HealthBench Hard、HealthBench Professional三年夜权势巨子医疗榜单中同时位列世界第一,逾越GPT-5.五、Opus 4.七、DeepSeek-V4-Pro等模子。依托原创的事实性感知强化进修算法,Baichuan-M4将裸模子的事实性幻觉率降至3.3%。
百小医
百川行将发布的AI家庭大夫“百小医”,产物焦点定位是,“明大白白看大夫,安放心心管家人”。它将基在微信生态运作,于对于话中捕获并布局化每一个人的身体状况、用药汗青及查抄数据,辨认一样平常闲谈中的高危旌旗灯号,自动提示复诊及用药等举动。
版权所有,未经许可不患上转载
-今年会·(jinnianhui)金字招牌








