需要说明的是,MedBench当前包含不同评测体系,其中智能体评测榜单采用API方式进行模型调用评估,更贴近实际应用链路;而智能体自测榜单则基于模型答案上传方式生成结果。两类榜单在评测机制与数据来源上存在差异,不具备直接横向对比基础。
此次卓睦鸟医疗大模型的评测结果,来源于API调用路径下的智能体评测体系,重点考察模型在真实任务环境中的综合表现能力。长期以来,医疗大模型的应用主要集中在信息检索、文本生成与辅助问答等环节。然而在真实医疗场景中,医生面临的核心问题不仅是“获取信息”,更包括文献整理、病历处理、科研支持与患者管理等复杂任务。在这一背景下,中康科技推出面向医生群体的AI专业智能助理——MedMate,尝试推动医疗AI从“信息支持工具”向“任务执行系统”演进。MedMate定位为“中国首个医生超级助理”,基于卓睦鸟医疗大模型构建,覆盖临床诊疗、科研辅助及患者管理等多类高频场景。MedMate采用“医生智能体 + 医生小龙虾”的双端协同架构,尝试在医疗AI中建立从认知到执行的系统能力闭环。医生智能体依托卓睦鸟医疗大模型能力底座,主要承担医学理解与决策支持功能,包括:● 基于五维循证机制(时效性、权威性、证据性、相关性、逻辑性)提升输出可靠性与可验证性 医生“小龙虾”主要承担医疗任务的执行能力,将医生指令转化为可完成的工作流程:● 覆盖文献检索、病历整理、科研辅助、数据分析等场景 ● 提供Skills Store技能体系,支持多场景扩展 其核心目标是降低医生在日常工作中的操作负担,提升任务处理效率。//从“辅助工具”到“工作系统”:医疗AI的结构性升级当前医疗AI产品大多仍停留在“辅助工具”阶段,主要提供信息支持与内容生成能力。而MedMate尝试将AI能力嵌入医生工作流本身,使其具备一定的任务执行能力与流程协同能力。从行业发展来看,医疗大模型正在从单一能力竞争,进入系统化能力竞争阶段,即是否能够真正进入医疗工作流程并承担实际任务。卓睦鸟医疗大模型在MedBench智能体评测榜单中的领先表现,验证了其在API调用环境下的综合能力。而MedMate则在此基础上,将模型能力进一步产品化,形成“认知 + 执行”的双端协同体系。这一体系的核心价值在于,使医疗AI从“可用能力”进一步走向“可落地系统”。医疗AI的发展正在从“回答问题”走向“完成任务”。在这一过程中,模型能力只是起点,真正的关键在于是否能够进入医生的真实工作流,并形成稳定的任务闭环。MedMate通过双端协同架构,尝试在医疗AI中构建这一闭环,并在临床、科研与管理场景中逐步验证其应用价值。我们的官网地址:https://doctor-agent.sinohealth.com/#/login
我们的APP下载二维码和医生小龙虾的下载二维码:
我们启动了「MedMate 先锋体验官千人计划」,招募医生、科研人员和医疗机构来参与。成为体验官你能拿到产品共创权、终身VIP权益(解锁全部 200+ 医学技能)、还有专属学术支持,优先获取新功能、参与闭门研讨会。
这不是试用,是共建。医疗 AI 该往哪走,得临床说了算。模型参数不是终点,场景价值才是。欢迎每一位医生成为 MedMate 的「产品合伙人」,你提的每一个需求、反馈的每一个问题,都在塑造医疗 AI 的未来。