欢迎来到纳米网!
首页 > 新闻 > 医疗与健康电子>正文

云知声山海医疗大模型:MedBench4.0三项榜首解析

12月16日,中文医疗大模型权威评测平台MedBench4.0发布最新评测结果。云知声自主研发的“山海医疗大模型(UniGPT‑Med)”展现出全面领先的技术实力,一举斩获医疗智能体、医疗大语言模型、医疗多模态大模型三项技术范式,成为本次评测中表现最为突出的“三冠王”。

b2df61c0-defc-11f0-8c8f-92fbcf53809c.png

其中,UniGPT‑Med‑U1在医疗大语言模型评测中以综合得分65.7分登顶,力压Grok-4(58.4)Claude-Sonnet-4.5、Gemini-2.5-Pro、GPT-5等一众国际顶尖模型。同时,在医疗智能体评测中以综合得分94.6分的优异成绩,大幅领先第二名Claude-Sonnet-4.5(88.8)近6分;

b343064e-defc-11f0-8c8f-92fbcf53809c.png

MedBench4.0-医疗大语言模型评测榜单

b3a05358-defc-11f0-8c8f-92fbcf53809c.png

MedBench4.0-医疗智能体评测榜单

UniGPT‑Med‑VL则在医疗多模态大模型评测中以综合得分59.6分摘得桂冠,领先第二名GPT-5(53.7分)近6分,展现出绝对技术优势。

b4022402-defc-11f0-8c8f-92fbcf53809c.png

MedBench4.0-医疗多模态大模型评测榜单

MedBench评测平台由上海人工智能实验室、上海市数字医学创新中心联合多家权威机构共同打造,以其科学、公平、严谨的评测体系著称。2025年11月20日,该平台全面迭代更新至4.0版本,成为全国首个且唯一面向垂直模型、专用模型及各应用场景的医疗大模型评测与验证体系。本次升级聚焦实战化评测突破与生态化开放共建两大核心,全面覆盖医疗大语言模型、医疗多模态大模型及医疗智能体三大技术范式,并深度对齐国家《卫生健康行业人工智能应用场景参考指引》,旨在为医疗AI从技术可行走向临床可用搭建关键的验证桥梁。

基于严格的医学标准,平台构建了高质量、多维度、覆盖广泛的评测集。其中,医疗大语言模型评测涵盖5大能力维度、36个专业子集,约70万条数据;医疗多模态大模型评测聚焦3大核心能力、10个专业子集;医疗智能体评测则围绕6大行动维度设置了14个复杂任务集。在此严苛且全面的评估框架下,山海大模型能够一举夺得三项冠军,充分彰显了其极高的技术含金量与实用价值。

此次评测的卓越表现,得益于山海医疗大模型最新版本完成的系统性核心升级。新版本致力于构建业界能力维度最丰富的医疗AI技术支撑体系,其核心亮点在于实现了“医学文本大模型”与“医学多模态大模型”双核心产品体系的深度融合,全面覆盖从文本处理、智能体协同到影像解析的多元功能,形成了当前能力维度最丰富的医疗AI技术架构。

通过深度融合模拟临床思维的复杂推理能力,模型实现了精准的鉴别诊断与循证决策支持;同时,原生内化的任务规划、工具调用与多智能体协作等核心能力,推动其完成了从“医学认知大脑”向“自主医疗行动者”的关键进阶,能够高效适配并执行复杂的真实医疗任务流程。

在多模态能力方面,新版本展现出对临床场景的深度赋能。它不仅能够精准识别X光、CT、MRI等多种医学影像中的病灶与解剖结构,高效提取医疗文档关键文本信息,更支持跨模态语义对齐与联合推理,能够融合影像特征与临床描述进行综合判断,为临床决策提供多源数据支撑的精准建议。

权威榜单的成绩是技术实力的显性证明,而真正的价值在于临床实践的检验与认可。依托该模型,云知声推出了覆盖诊疗全流程的“智慧医疗产品矩阵”,涵盖智能病历生成与质控、临床辅助决策、医疗质量监管、医保支付智能审核以及智慧患者服务等核心产品。这些产品已深入医政管理、临床诊疗、运营管理和患者服务等关键环节,并在全国部署近400家医院,700余家医院进入测试阶段。其中覆盖北京协和医院、北京友谊医院、东南大学附属中大医院、青岛大学附属医院等数百家国内顶级三甲医院。

在提升诊疗效率与质量方面,落地案例成效显著。例如,门诊病历生成系统能够实时捕捉医患之间的对话内容,智能提取关键问诊信息,并自动生成结构化病历。医生仅需进行简单审核,即可完成病历书写工作。目前该系统已在北京友谊医院顺义院区广泛应用,单份病历直接引用率接近90%,大幅降低了医生文书负担;智能病历质控系统能够精准理解病历内容,并智能识别其中的书写错误与缺陷。系统对影像描述、专业术语进行细致分析,并对检查结果、检查结论以及检查依据进行深度解读,从而实现高效、精准的病历质控;DRG/DIP医保支付管理系统以智能提醒和数据分析两种方式,从诊疗过程中、医保结算前到医保结算后,为医生、质控员、编码员和医保处提供全流程、全方位的医保支付管理服务。该系统成功助力中国人保财险完成核赔风控AI医疗审核系统的全国性部署。

作为AGI技术的先行者,云知声始终致力于以专业大模型和全栈自研AI技术解决产业核心问题。山海医疗大模型在三大核心评测维度的全能夺冠,标志着其技术体系实现了从底层认知、多模态理解到上层智能体执行的全栈式、一体化突破,为医疗AI的深度临床应用树立了新的标杆。

未来,云知声将继续深耕医疗AI领域,持续推动更加安全、可靠、智慧的医疗AI解决方案在广泛场景中落地应用,赋能医疗服务体系的质量与效率升级,为助力健康中国建设贡献坚实的科技力量。

原文标题:云知声山海医疗大模型问鼎MedBench4.0三项榜首,以“三冠王”战绩树立医疗AI新标杆

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

猜你喜欢

  • 艾为电子AW9967FSR:高效升压型WLED驱动芯片详解

    艾为电子AW9967FSR:高效升压型WLED驱动芯片详解

    在消费电子持续追求轻薄化与长续航的当下,背光系统能效成为关键瓶颈。传统方案在轻载场景效率低下,散热性能不足,严重制约设备续航并带来可靠性风险。数模龙头艾为电子推出新一代升压型WLED驱动芯片——AW9967FSR,以科学先进的热管理技术,打造卓越的散热...

    2025-12-01
  • Microchip发布MCP服务器:革新AI驱动的产品数据访问方式

    Microchip发布MCP服务器:革新AI驱动的产品数据访问方式

    该服务器支持跨AI平台获取可信产品信息,简化工作流程、加速设计并提高生产力 为进一步兑现公司为嵌入式工程师开发AI解决方案的承诺,Microchip Technology Inc.(微芯科技公司)今日推出模型语境协议(MCP)服务器。作为AI接口,MCP服务器可直接连接兼容的AI...

    2026-01-23
  • Microchip第22届中国技术精英年会北京站成功闭幕,下一站深圳

    Microchip第22届中国技术精英年会北京站成功闭幕,下一

    Microchip第22届中国技术精英年会(MASTERs)北京站于今日圆满落幕!来自各地的技术专家、行业伙伴和客户齐聚一堂,共同探讨前沿技术与创新应用。活动伊始,Microchip大中华区副总裁Edward Ho先生为本站致开幕词,欢迎各位嘉宾的到来,并分享了对行业发展的展望...

    2026-01-23
  • 国星半导体车规级LED芯片获2025年广东省名优高新技术产品

    国星半导体车规级LED芯片获2025年广东省名优高新技术

    近日,广东省高新技术企业协会正式发布《2025年第二批广东省名优高新技术产品名单》,国星半导体自主研发的车规级LED芯片与垂直LED芯片两大系列产品成功入选。该认定严格围绕技术创新性、质量稳定性、市场成熟度及产业化能力四大维度进行评审,是广东省...

    2025-12-02
  • 云英谷科技荣登2025中国半导体企业影响力百强,专注OLED显示驱动芯片

    云英谷科技荣登2025中国半导体企业影响力百强,专注OLED

    11月14日,世界集成电路协会(WICA)主办的“2025全球半导体市场峰会”在上海成功召开。本次峰会发布了2026全球半导体市场趋势展望暨2025中国半导体企业影响力百强及集成电路新锐企业50强报告。云英谷科技股份有限公司荣登“2025中国半导体企业影响力百...

    2026-01-23
^