开源医疗大模型拿下全球第一，百川M3给OpenAI上了一课。

qimuai 发布于 2026-1-14 18:02 阅读：63 AI新闻

最新AI落地实操，点击了解：https://qimuai.cn/

今天，2026年1月13日，医疗AI领域被刷新了一次。

百川智能开源了新一代医疗大模型 Baichuan-M3。它不是“又一个模型”，而是直接拿下了全球第一。

有多硬核？

它在目前全球最权威的医疗AI评测 HealthBench 上，综合得分 65.1，直接登顶。

更关键的是，在最考验复杂决策能力的 HealthBench Hard 子集上，它以 44.4分，把OpenAI的王牌模型 GPT-5.2 High 都甩在了身后。

这个成绩，含金量十足。HealthBench由OpenAI在去年5月发布，包含5000组多轮医疗对话，全部由262位真实医生亲手构建和打分。它模拟的，就是医生问诊、诊断的真实流程。

换句话说，M3不仅通过了“考试”，而且在这场由顶尖“考官”出题的竞赛中，考了全球最高分。

但分数只是结果。M3真正让人意外的，是它的思路变了。

过去的医疗AI，更像是“高级题库搜索器”。你问，它答。信息可能都对，但总感觉隔了一层。

M3不一样。它首次具备了原生的 “端到端严肃问诊” 能力。你可以理解为，它开始像一名真正的医生那样思考和工作了。

面对一个患者，M3不再是被动地等待你描述所有细节。它会主动追问——追问病史，追问症状细节，识别风险信号，直到掌握相对完整的信息链条。然后，它才开始进行深度的医学推理。

这一步，是质变。百川为了打磨这个能力，甚至联合150多位一线医生，专门构建了一个名为 SCAN-bench 的评测体系，模拟医学生毕业前必须通过的OSCE临床技能考试，覆盖从病史采集、辅助检查到最终诊断的全过程。

从“答题机器”到“思考伙伴”，M3把AI在医疗中的角色，往前推了一大步。

这玩意怎么用？从今天开始，任何人都能体验。

在百川智能的“百小应”网站或App上，M3提供了两种模式：

让技术变得可触可感，这可能是推广AI最实在的一步。

为什么是百川？为什么是现在？

在1月13日下午的媒体沟通会上，百川智能创始人王小川给出了答案。他坦言，公司从2023年起就All in“医疗大模型”和“生命模型”这条艰难的路，初期面临过不少质疑。

他们的目标很明确：第一步，用M3提升基层医疗的效率和准确性；长期目标，是通过持续的数据积累，构建一个真正的“生命数学模型”。 这条路通向的是AI医疗的深度商业化。据透露，百川目前账上资金充足（约30亿元），并有计划推出C端应用。

选择此刻开源M3，更像是一次战略亮剑。看看周围：OpenAI的ChatGPT Health、Anthropic的Claude for Healthcare早已入局；谷歌也在近期更新了能读懂CT/MRI影像的MedGemma 1.5和医疗语音转文本工具MedASR。

赛道已经非常拥挤。中信证券的报告也指出，2026年，AI医疗的商业化确定性正在急剧增强。

在这个时间点，百川用一份“全球第一”的成绩单和完全开源的动作，不仅证明了技术实力，更是在向整个生态发出邀请。竞争白热化，往往意味着真正的变革即将开始。

医疗，这个最复杂、最严谨、也最关乎生命的领域，正在被AI以新的方式重构。

所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发，了解加微信：qimugood(读者也可此微信一起交流）。

文章目录

扫描二维码，在手机上阅读