开源医疗大模型拿下全球第一,百川M3给OpenAI上了一课。

最新AI落地实操,点击了解:https://qimuai.cn/
今天,2026年1月13日,医疗AI领域被刷新了一次。
百川智能开源了新一代医疗大模型 Baichuan-M3。它不是“又一个模型”,而是直接拿下了全球第一。
有多硬核?
它在目前全球最权威的医疗AI评测 HealthBench 上,综合得分 65.1,直接登顶。
更关键的是,在最考验复杂决策能力的 HealthBench Hard 子集上,它以 44.4分,把OpenAI的王牌模型 GPT-5.2 High 都甩在了身后。
这个成绩,含金量十足。HealthBench由OpenAI在去年5月发布,包含5000组多轮医疗对话,全部由262位真实医生亲手构建和打分。它模拟的,就是医生问诊、诊断的真实流程。
换句话说,M3不仅通过了“考试”,而且在这场由顶尖“考官”出题的竞赛中,考了全球最高分。
但分数只是结果。M3真正让人意外的,是它的思路变了。
过去的医疗AI,更像是“高级题库搜索器”。你问,它答。信息可能都对,但总感觉隔了一层。
M3不一样。它首次具备了原生的 “端到端严肃问诊” 能力。你可以理解为,它开始像一名真正的医生那样思考和工作了。
面对一个患者,M3不再是被动地等待你描述所有细节。它会主动追问——追问病史,追问症状细节,识别风险信号,直到掌握相对完整的信息链条。然后,它才开始进行深度的医学推理。
这一步,是质变。百川为了打磨这个能力,甚至联合150多位一线医生,专门构建了一个名为 SCAN-bench 的评测体系,模拟医学生毕业前必须通过的OSCE临床技能考试,覆盖从病史采集、辅助检查到最终诊断的全过程。
从“答题机器”到“思考伙伴”,M3把AI在医疗中的角色,往前推了一大步。
这玩意怎么用?从今天开始,任何人都能体验。
在百川智能的“百小应”网站或App上,M3提供了两种模式:
- 医生版:界面简洁,回答专业,关键结论会直接引用医学文献。
- 患者版:更像一个耐心的“AI医生”,会对你进行多轮追问,给出更易懂的解释。
让技术变得可触可感,这可能是推广AI最实在的一步。
为什么是百川?为什么是现在?
在1月13日下午的媒体沟通会上,百川智能创始人王小川给出了答案。他坦言,公司从2023年起就All in“医疗大模型”和“生命模型”这条艰难的路,初期面临过不少质疑。
他们的目标很明确:第一步,用M3提升基层医疗的效率和准确性;长期目标,是通过持续的数据积累,构建一个真正的“生命数学模型”。 这条路通向的是AI医疗的深度商业化。据透露,百川目前账上资金充足(约30亿元),并有计划推出C端应用。
选择此刻开源M3,更像是一次战略亮剑。看看周围:OpenAI的ChatGPT Health、Anthropic的Claude for Healthcare早已入局;谷歌也在近期更新了能读懂CT/MRI影像的MedGemma 1.5和医疗语音转文本工具MedASR。
赛道已经非常拥挤。中信证券的报告也指出,2026年,AI医疗的商业化确定性正在急剧增强。
在这个时间点,百川用一份“全球第一”的成绩单和完全开源的动作,不仅证明了技术实力,更是在向整个生态发出邀请。竞争白热化,往往意味着真正的变革即将开始。
医疗,这个最复杂、最严谨、也最关乎生命的领域,正在被AI以新的方式重构。
所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。
文章标题:开源医疗大模型拿下全球第一,百川M3给OpenAI上了一课。
文章链接:https://blog.qimuai.cn/?post=2854
本站文章均为原创,未经授权请勿用于任何商业用途