真实世界需要怎样的医疗AI？-一点财经的专栏

真实世界需要怎样的医疗AI？

2026-05-20 12:24:12栏目：健康 IP属地：IP未知

2026年中国医疗健康垂直领域大模型数量将会达到350—400个？这是个惊人的数字。

按照动脉智库报告，2025年5月时国内医疗大模型数量累计达到了288个，全年增长了133个，超过前两年的总和。

去年年中，毕马威发布的行研报告显示：中国已发布的医疗大模型数量占全球总量的超70%，位居全球第一，远超其他国家和地区。

而以目前增速估算，2026年国内医疗大模型将迫近400个，进一步将其他国家和地区划进了“Other”一栏。

不得不说，在中国庞大的人口基数和患者规模之上，丰富的医疗场景与数据资源为医疗大模型提供了无与伦比的沃土。

数量还只是一方面。去年8月，国家发改委联合22部门实施“人工智能+”行业应用专项行动，其中在医疗领域，要推动AI应用从辅助诊断向全流程诊疗协同。

从预问诊、诊前分诊到诊中辅助诊断、病历生成，到诊后随访管理的全流程，医疗AI的能力边界持续扩张，医疗AI已经从基础探索转向临床规模化落地。

“卷应用”是当前医疗大模型厂商的主旋律，但医疗AI的应用还需要通过“真实临床世界”的信任考验。

中国医师协会发布的2025年调研报告显示，仅有31%的基层医生“完全信任”AI诊断结果，而68%的患者对AI参与诊疗表示“强烈担忧”。

在飞利浦发布的2025年《未来健康指数报告》（中国版）中，亦提出“围绕信任差异”医患双方观点分化是当前医疗AI最大的应用痛点。

所以在真实世界的复杂环境中，医疗AI的稳定性与可追溯性是跨越信任鸿沟的前提条件。

好在，我们看到中国医疗AI大模型量变的同时也在应用探索中寻找质变的生存方式。

壹|升维突破

什么是可信赖的？

“概念可用、临床不敢用”，是一道横亘在医疗AI落地真实临床场景的信任鸿沟。

2026年5月1日，哈佛医学院联合斯坦福大学在《Science》发表的一项关于医疗AI大模型诊断率的分析研究，揭示了AI在真实临床场景中的表现。

在急诊真实病例诊断准确率上，OpenAI o1模型在波士顿一家医院76名真实急诊患者的双盲测试中，诊断准确率达67%，超越两位资深内科主治医生的55%和50%。

在信息最匮乏的分诊阶段，医疗AI模型优势最为明显，准确率领先达12—17个百分点；在治疗方案制定能力上，o1模型决策测试中位得分为89%，领先使用传统资源的医生55个百分点。

在临床推理、病例评估以及标志性病例分析结果的测试中，o1-preview以超强的泛化能力碾压人类医生。

这项分析研究的结果表明目前医疗AI模型已经相比两年前GPT-4等模型在模拟病例NEJM的测试中“靠谱”了很多。

应用的障碍本质上并非技术问题，而是信任问题。其实国内类似研究，也经历了同样的过程。

比如2024年上海交大与上海AI实验室发布的研究报告，彼时结论是“GPT-4V在基础感知任务上表现尚可，但在疾病诊断、报告生成等高阶临床任务上存在明显不足，远未达到临床实用标准。”

但两年后，在国际数据公司（IDC）最近发布的《中国医疗大模型技术评估（2026）》报告中，以“其在实际业务场景中的卓越应用表现，稳居行业第一梯队”的结语，评价东软“添翼医疗大模型”。

IDC此次的技术评估是基于模型性能、安全和数据、病历生成、病例分析、医疗智能体开发、诊后管理及随访、服务能力等十多个维度的综合测评，而东软添翼医疗大模型在多个维度的测评中拿到了满分评价。

这也并不奇怪，因为添翼本就有着“打底”2000余项数据质量标准、50余项安全规则、迭代近70个高质量专病数据集的牢固根基。

更重要的是，为了实现在真实业务场景应用中跨越信任鸿沟，东软率先推动传统医疗大模型向“可信医疗AI”的升维。

这里我们需要理解的是传统医疗大模型是以大参数规模、海量医学语料训练和通用生成能力为基础的，重点解决的是医疗场景中内容生成与知识问答等。

简单来说，传统大模型解决的是“能理解”“能生成”“能回答”的问题，但在这个过程中存在一些无法回避的问题：比如幻觉频发、黑箱推理、依据不可查、过程难追溯等。

我们日常用的一些AI工具其实是普遍存在这样的问题，但在医疗场景中AI一旦出现错误地生成可能就会带来严重的后果，一次不透明的判断就会让临床医生丧失信心。

正是这些原因，业界认为可信医疗AI的逻辑是面向真实医疗场景能安全运行和持续落地，以医学证据为基础、以逻辑推理为核心、以结果可理解、过程可追溯、结论可验证为特征的医疗智能形态。

说到底，可信医疗AI的升维突破就是解决了“敢不敢用”的核心痛点。

贰|添翼三法

为什么东软可以？

以“可信”为底层逻辑，AI 原生、循证驱动、智能体协同，这是东软一贯对其医疗AI产品核心设计理念与价值主张。

体现在医疗AI上就是“具备证据链、推理链和责任支撑能力”的医疗协同，这相较传统医疗大模型“智能助手”的角色，又向前跃进了一大步。

从应用进展来看，承载着可信理念的东软目前已开发出120+智能体，并在全国范围内的100多家医疗机构开始规模化应用。

根据公开信息，我们整理出的东软添翼大模型的医疗场景应用集中分布在三个方向上：

其中最为核心的是“智慧临床”，诸如病历生成、病例分析、临床医生助手、诊后管理和随访管理等诊疗全流程，这也是医疗大模型最卷的应用方向。

基于东软集团常年深耕医疗信息化，东软添翼在医院智慧管理方向的应用同样丰富：医疗质量管理、运营数据分析、行政管理、科研支持等等。

还有就是智慧服务方向，比如患者服务、医患沟通、健康科普等场景与内容。这个方向虽然很基础，却是在细节上体现医疗AI帮助医疗机构提升服务质量的关键。

“可信”作为研发设计的底层逻辑，东软将其融入添翼医疗大模型及其他系列医疗AI解决方案、产品与服务中，核心要解决的是医疗AI应用进化的三方面：

要深度融入真实医疗场景，医疗AI的第一性原则必须让用户在无感中提效，所以它就不能只是一个“外挂”的工具，它必须以原生形态嵌入HIS、EMR等核心业务流，而这恰好是东软最擅长的。

东软添翼医疗大模型与东软新一代添翼智慧医院解决方案实现原生级融合。

添翼不仅提供模型能力，更通过面向AI原生设计的开放架构体系，构建AI可读、可调用、可编排的标准化API与业务能力接口，使AI能够真正理解并参与医院业务运行。

另一个关键性原则是医疗本质是严谨的，所以医疗AI不能做黑箱推理，大模型与确定性的临床指南、专家共识等需要深度耦合，形成循证驱动认知，真正确保每一条输出的建议都是有据可依，而非“概率推测”。

再就是医疗场景其实远比我们看到的要繁复细碎得多，如果贯穿诊疗全流程甚至还有院外随访，那么这就需要建立多个专业智能体协作的集群生态。

有“可信”的逻辑底座，东软各专业智能体便解决了高效协同的问题，可深度融入诊疗、管理、医保与运营全流程，实现数据、流程、规则与智能能力的一体化。

当然，所有这些场景应用都离不开高质量的数据燃料。

东软添翼大模型的数据燃料来源包括50万例电子病例标注数据构建的语料库；97万例医学概念、128万条医学术语库和覆盖10549种ICD编码疾病的疾病知识与临床诊疗知识库。

此外，东软还拥有涵盖49种疾病的354个医学影像数据集，包括190万个病人、154万次检查数据以及1亿+标注的影像切片，以及创新医学影像数据智能分析技术。

这里不得不说东软的另一个优势：工程化落地能力。

依托长期深耕医疗信息化行业的产业基础，东软让客户以更低成本、更小改造量、更短上线周期，快速完成AI能力落地，并最大化释放既有信息化系统价值。

综上，IDC技术评估为何能将东软列为一线，原因就在于其对医疗业务理解深度、场景融合能力和工程化落地能力。

而东软添翼也以其表现证明了可信医疗AI是完全可以被量化、被验证、被实现的。

叁|深水展望

商业化才露尖尖角

2026年将会是又一个分水岭，医疗AI在度过了前两年的验证期后，进入规模化应用的新阶段。

而在这个阶段，另一个问题也正在变得现实起来：医疗AI的商业化路径如何从概念验证走向真实价值创造。

来自全球知名商业市场研究机构Grand View Research的一份中国医疗AI市场规模与展望报告显示，2025年中国医疗AI实现28.29亿美元（约198亿元人民币），预计至2033年将达408.44亿美元，复合增长率高达39.7%（2026-2033）。

显然，这是一个谁都不愿意错过的史诗级的机会。

以to G、to C、to B这三条医疗AI的主要赛道来看，B端市场是最直接、最现实，商业化诉求最显性的市场，但合规成本、政策风险以及商业化周期等门槛也都是各参赛选手需要解决的问题。

从市场格局洞察，这三条赛道林林总总挤满了参与者，既有BAT等互联网大厂，也有华为、讯飞这种超级硬件厂商，还有如联影、数坤等专业细分赛道选手。

相比之下，已深耕医疗与智慧城市行业数十载的东软集团，可谓行业“老炮”。但与传统医疗信息化公司又不尽相同，东软在医疗AI领域的投入与表现可谓“激进”。

这两年东软的战略转型幅度、力度，已经表明这家IT解决方案商正在“All in”向“AI+行业”转型，医疗领域正是其重中之重。

2025年上市公司年报中，东软集团“AI+医疗”的合同金额6.91亿元，同比增长了42%。合同履约覆盖100+机构，医疗AI规模化落地初步验证了商业化的可能性。

这才只是个开始。

毕竟中国医疗IT应用市场排名第一的东软集团，拥有超500家三甲医院、2000余家三级医院、50000+基层医疗机构以及超200个城市医保系统资源，上述机构覆盖只是冰山一角。

何况东软集团构建的是一个庞大的、系统性的大健康战略实盘，涉及医疗数字化、医疗设备、医疗服务、康养服务、金融保险、医工人才等多个方向。

这种数十年形成的全产业链布局，在AI时代意味着东软拥有庞大的数据燃料资源，这比算法形成的壁垒要更高，更无法速成。

东软添翼医疗大模型以“可信”为锚点，跨越真实医疗场景的信任鸿沟，开始加速规模化应用，这是其未来故事的最新篇章。

不过，也要看到医疗AI本身投入巨大、商业化周期又非常长，竞争也愈发激烈，因此东软集团还必须在财报上做好平衡投资回报的规划。

最后，我们还需要看到政策带来的“变量”因素：

2025年7月，中国药监局（NMPA）发布的“优化全生命周期监管支持高端医疗器械创新发展有关措施”的公告》中，医用大模型作为“人工智能医疗器械”的子类别，被纳入高端医疗器械全生命周期监管框架，适用创新通道、简化变更注册、专项标准制定等支持政策。

这则公告实际上大大推高了医疗AI的“准入门槛”，审核更侧重真实世界研究，这也意味着那些“外挂”或者“套壳”的医疗AI产品会被淘汰出去。

反之，东软“可信医疗AI”的实践和推进正好踩上了政策风口，而其实力与合规能力在行业中位列一线，自然也就会获得更多的市场机会。