2025年,随着DeepSeek等通用大模型在医疗领域的广泛应用,医疗智能体迎来了前所未有的发展机遇。近期,多家医疗机构、医疗健康服务企业围绕具体场景应用,密集上线医疗智能体。这也使得业界从几个月前“言必谈大模型”的状态,悄然迈入“言必谈智能体”的新阶段。
一、从“百模大战”到“千体之争”
大模型与智能体的关系,可以简单概括为“认知”与“行动”的分工协作:大模型专注于自然语言理解、逻辑推理等抽象能力,能精准解析用户意图、生成任务规划逻辑;智能体则可通过传感器、API接口等实现环境信息感知与任务工具调用。二者的结合,如同为智能体装上“大脑”,为大模型赋予“身躯”,形成技术闭环。
智能体具备持续学习、自我训练、自我评估和动态目标调整的特征,在复杂任务调度、协作场景中表现出强大潜力。具体到医疗领域,智能体在提升医疗服务可及性、优化临床流程、推动精准医疗等方面可展现出应用价值。
目前,医疗健康多个场景均已出现智能体的身影。在院内,无论是患者服务、辅助诊疗还是医院管理,都已有医疗机构和企业联合发布相应的智能体;在院外,以互联网医疗、健康管理为主的企业推出了AI家庭医生、AI健管师、AI心理咨询师等智能体;此外,智能体还覆盖科研与教学、药物研发等领域,甚至能作为企业数字员工,在不同企业的职能岗位上发挥作用。

二、拟人化与专科化的进阶之路
随着智能体的发展,其“拟人化”趋势愈发明显,虚拟形象与专属名称成为重要的突破口。目前,已经有多家企业从“人的形象”入手打造产品,包括采用虚拟人物形象、医务人员真人形象,甚至为智能体角色起一个朗朗上口的名字。例如,2024年11月,紫荆智康开发的“紫荆AI医生”系统正式上线,首批来自21个科室的42位AI医生在Agent Hospital亮相。其中,每个科室设置2位AI医生,一位来自国内,一位来自国际,且每位AI医生都拥有专属的虚拟形象和名字。专科化成为医疗智能体发展的另一关键方向。不同专科的疾病特征、诊疗路径和治疗需求各不相同,通用模型往往难以满足这些复杂多样的需求。例如,四川大学华西医院联合研发的“睿兵Agent”,专注于消化领域的疾病管理,通过融合医学大模型与临床专家经验,实现了健康知识普及、疾病全程管理以及科研辅助支持等多功能集成。这种专科化的智能体不仅能够提高医生的工作效率,还能将顶级医疗机构的经验复制到基层,提升整体医疗服务水平。

在智能体大量涌现的背景下,专科诊疗智能体正在迅速崛起。例如,深圳大学华南医院近期上线了腹痛诊疗智能体,针对腹痛症状可自动调用“腹痛”专用知识库。面对复杂多样的腹痛症状,该智能体能够帮助医生参考专家诊疗思路快速完成鉴别诊断与初步分流,从而降低基层医生的误诊率。
由于各专科具有特定的诊疗路径,这就要求智能体具备定向进化的能力。不同专科面临的临床问题各不相同,通用模型难以满足专科的特定需求。通过专科定制化训练,智能体可突破通用模型的精度瓶颈。在智能体的辅助下,专科诊疗的质量和效率将得到大幅提升。在此基础上,专科智能体还能更好地沉淀顶级医疗机构或专家的经验,并将其向基层医疗机构复制输出。

三、成为真正意义上的医疗智能体,仍需多方面提升
然而,尽管医疗智能体在应用层取得了显著的进展,但目前仍主要是应用层的迭代升级,尚未实现底层模型的突破。浙江大学计算机创新技术研究院智慧医疗研究中心主任相鹏指出,智能体能够调用工具(如浏览器、API)、操作软件界面,形成“指令-思考-交互-观察-再思考”的闭环,是一种不仅能思考,还可以采取行动的AI系统。在他看来,按照认知与行动的复杂度,智能体相当于L3级的AI应用。相较于L2阶段,AI从被动的“信息处理/推理”走向主动的“与外部世界交互和执行”。尽管当前业界已有大量“智能体”,但真正能达到L3水平的极少,大部分仍然处于L1阶段,能达到L2的也不多。
现有的医疗智能体大多在功能和能力方面还有待丰富与提升。以专科专病医生助手型智能体为例,真正的智能体要串联起就诊各环节的逻辑,需经过三轮必不可少的训练。第一轮是预训练,积累各类知识,包括教材、学科知识、院士专家经验、指南等,这是基础的经验能力储备。第二轮是正式训练,培养“慢思考”能力,让智能体能规划行动以配合医生,这需要通过医生的实际使用来积累过程经验。第三轮是续训练,提升高阶推理、自主交互及持续学习能力,让智能体更贴近人类,最终能切实帮助医生处理事务,且风格接近医生本人。经过正式训练的智能体,在之后的续训练中,会逐渐贴合医生的风格与习惯,成为真正的助手。而目前许多智能体还未完成正式训练这一步。
总的来说,医疗AI应用要成为真正意义上的智能体,还需从多个方面提升。首先,需要临床决策与实际行动的无缝衔接。仅靠技术人员基于知识整理和基础开发,所形成的智能体与普通AI解决方案的区别不大,医生的使用效果也不会理想。其次,促进行业规范至关重要,例如明确智能体的功能、范畴及达标要求,避免因概念模糊、能力界定不清引发认知混乱、产品定位不明。最后,大模型底座的执行能力,仍是推动智能体从概念真正成为现实的源动力。这场“千体之争”的终局,不在于谁能最快复制人类医生,而在于如何构建人类智慧与人工智能的共生新生态。
