云知声山海医疗大模型：MedBench4.0三项榜首解析

2025-12-29

12月16日，中文医疗大模型权威评测平台MedBench4.0发布最新评测结果。云知声自主研发的“山海医疗大模型（UniGPT‑Med）”展现出全面领先的技术实力，一举斩获医疗智能体、医疗大语言模型、医疗多模态大模型三项技术范式，成为本次评测中表现最为突出的“三冠王”。

其中，UniGPT‑Med‑U1在医疗大语言模型评测中以综合得分65.7分登顶，力压Grok-4（58.4）Claude-Sonnet-4.5、Gemini-2.5-Pro、GPT-5等一众国际顶尖模型。同时，在医疗智能体评测中以综合得分94.6分的优异成绩，大幅领先第二名Claude-Sonnet-4.5（88.8）近6分；

MedBench4.0-医疗大语言模型评测榜单

MedBench4.0-医疗智能体评测榜单

UniGPT‑Med‑VL则在医疗多模态大模型评测中以综合得分59.6分摘得桂冠，领先第二名GPT-5（53.7分）近6分，展现出绝对技术优势。

MedBench4.0-医疗多模态大模型评测榜单

MedBench评测平台由上海人工智能实验室、上海市数字医学创新中心联合多家权威机构共同打造，以其科学、公平、严谨的评测体系著称。2025年11月20日，该平台全面迭代更新至4.0版本，成为全国首个且唯一面向垂直模型、专用模型及各应用场景的医疗大模型评测与验证体系。本次升级聚焦实战化评测突破与生态化开放共建两大核心，全面覆盖医疗大语言模型、医疗多模态大模型及医疗智能体三大技术范式，并深度对齐国家《卫生健康行业人工智能应用场景参考指引》，旨在为医疗AI从技术可行走向临床可用搭建关键的验证桥梁。

基于严格的医学标准，平台构建了高质量、多维度、覆盖广泛的评测集。其中，医疗大语言模型评测涵盖5大能力维度、36个专业子集，约70万条数据；医疗多模态大模型评测聚焦3大核心能力、10个专业子集；医疗智能体评测则围绕6大行动维度设置了14个复杂任务集。在此严苛且全面的评估框架下，山海大模型能够一举夺得三项冠军，充分彰显了其极高的技术含金量与实用价值。

此次评测的卓越表现，得益于山海医疗大模型最新版本完成的系统性核心升级。新版本致力于构建业界能力维度最丰富的医疗AI技术支撑体系，其核心亮点在于实现了“医学文本大模型”与“医学多模态大模型”双核心产品体系的深度融合，全面覆盖从文本处理、智能体协同到影像解析的多元功能，形成了当前能力维度最丰富的医疗AI技术架构。

通过深度融合模拟临床思维的复杂推理能力，模型实现了精准的鉴别诊断与循证决策支持；同时，原生内化的任务规划、工具调用与多智能体协作等核心能力，推动其完成了从“医学认知大脑”向“自主医疗行动者”的关键进阶，能够高效适配并执行复杂的真实医疗任务流程。

在多模态能力方面，新版本展现出对临床场景的深度赋能。它不仅能够精准识别X光、CT、MRI等多种医学影像中的病灶与解剖结构，高效提取医疗文档关键文本信息，更支持跨模态语义对齐与联合推理，能够融合影像特征与临床描述进行综合判断，为临床决策提供多源数据支撑的精准建议。

权威榜单的成绩是技术实力的显性证明，而真正的价值在于临床实践的检验与认可。依托该模型，云知声推出了覆盖诊疗全流程的“智慧医疗产品矩阵”，涵盖智能病历生成与质控、临床辅助决策、医疗质量监管、医保支付智能审核以及智慧患者服务等核心产品。这些产品已深入医政管理、临床诊疗、运营管理和患者服务等关键环节，并在全国部署近400家医院，700余家医院进入测试阶段。其中覆盖北京协和医院、北京友谊医院、东南大学附属中大医院、青岛大学附属医院等数百家国内顶级三甲医院。

在提升诊疗效率与质量方面，落地案例成效显著。例如，门诊病历生成系统能够实时捕捉医患之间的对话内容，智能提取关键问诊信息，并自动生成结构化病历。医生仅需进行简单审核，即可完成病历书写工作。目前该系统已在北京友谊医院顺义院区广泛应用，单份病历直接引用率接近90%，大幅降低了医生文书负担；智能病历质控系统能够精准理解病历内容，并智能识别其中的书写错误与缺陷。系统对影像描述、专业术语进行细致分析，并对检查结果、检查结论以及检查依据进行深度解读，从而实现高效、精准的病历质控；DRG/DIP医保支付管理系统以智能提醒和数据分析两种方式，从诊疗过程中、医保结算前到医保结算后，为医生、质控员、编码员和医保处提供全流程、全方位的医保支付管理服务。该系统成功助力中国人保财险完成核赔风控AI医疗审核系统的全国性部署。

作为AGI技术的先行者，云知声始终致力于以专业大模型和全栈自研AI技术解决产业核心问题。山海医疗大模型在三大核心评测维度的全能夺冠，标志着其技术体系实现了从底层认知、多模态理解到上层智能体执行的全栈式、一体化突破，为医疗AI的深度临床应用树立了新的标杆。

未来，云知声将继续深耕医疗AI领域，持续推动更加安全、可靠、智慧的医疗AI解决方案在广泛场景中落地应用，赋能医疗服务体系的质量与效率升级，为助力健康中国建设贡献坚实的科技力量。

原文标题：云知声山海医疗大模型问鼎MedBench4.0三项榜首，以“三冠王”战绩树立医疗AI新标杆

文章出处：【微信号：云知声，微信公众号：云知声】欢迎添加关注！文章转载请注明出处。