蚂蚁医疗大模型在MedBench测评中表现出色,成功获得“双料”冠军荣誉,该模型在测评中展现了卓越的性能和实力,获得了医疗领域的高度认可和赞赏,蚂蚁医疗大模型的出色表现,为其在医疗领域的应用和发展奠定了坚实基础。
国内权威医疗大模型评测平台MedBench更新了其官网榜单,在多个医疗AI产品及研究团队的激烈竞争中,蚂蚁AI健康管家团队研发的蚂蚁医疗大模型以评测榜单97.5分、自测榜单98.2分的高分再次荣登榜首,实现了双料冠军的壮举。
(显示MedBench自测榜单截图的图片)
在MedBench的测评中,蚂蚁医疗大模型展现了强大的实力,不仅在医学知识问答、医学语言生成以及复杂医学推理等单项中位居第一,而且在医学语言理解以及医疗安全和伦理等方面也表现出色,此前,在综合榜单的测评中,蚂蚁医疗大模型也长期占据榜首位置。
医疗行业是一个复杂度较高的领域,医疗大模型的实时评估体系对于应用的稳定落地尤为重要,MedBench为中文医疗大语言模型提供了一个公平、透明且科学的评估标准,蚂蚁医疗大模型在榜单上的优秀表现,充分证明了其当前的技术能力转化为医疗AI产品的专业度和领先性。
值得一提的是,蚂蚁医疗健康团队近期完成了基于强化学习的新一代医疗推理模型的研发,升级后的AI引擎,不仅具备“医学思维”推理能力,还能完成“图、文、音视频等”多模态交互,蚂蚁医疗大模型还进行了百亿级中英文图文、千亿级医疗文本语料及千万级高质量医疗知识图谱的专业知识训练,经过真实场景的多任务微调以及强化学习,该模型在医学报告、药品、毛发等图像识别方面的准确率高达90%以上。
在安全性方面,蚂蚁医疗大模型集成了蚂蚁集团在隐私安全风控方面的技术优势,并严格遵循安全隐私标准进行数据使用的去标识化处理,自去年7月推出以来,该模型还提供了配套的“可信一体机+可信云”解决方案,以确保数据隐私和算力效率,为医院和医疗机构提供可靠的本地部署和数据保护支持。
蚂蚁医疗健康已有10年的发展历程,自2023年开始进军医疗AI领域以来,除了专注于垂直领域大模型技术的研发,其在AI应用层面也取得了显著的进展,公开资料显示,其与浙江卫健委合作推出的全国首个省级官方AI健康应用“安诊儿”已服务近3000万人次,覆盖了浙江省内1000余家医疗机构,蚂蚁医疗健康还与多家权威医疗机构、医院合作研发了近百个医生智能体,在AI辅助医生工作方面进行了深入的探索,完成对好大夫在线的收购后,双方合作推出了“AI科普助手”等系列产品,蚂蚁医疗大模型已成为业内应用场景最丰富、与医疗机构合作最深的垂类大模型之一。
展望未来,蚂蚁医疗健康将继续深耕医疗AI领域,不断研发创新技术,为医疗行业提供更多高效、安全、便捷的智能服务。