AIGC宇宙 AIGC宇宙

​国内首个!夸克健康大模型成功通过副主任医师考试

夸克健康大模型在全国副主任医师职称考试中表现出色,成功通过12门学科的评测,成为国内首个跨越这一门槛的大模型。 此次考试涵盖了全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学和麻醉学等12个常用学科。 夸克健康大模型在所有测试科目中均超过了合格线,并在全科医学、肿瘤内科学、皮肤与性病学、精神病学等四个学科达到了主任医师的及格线。

夸克健康大模型在全国副主任医师职称考试中表现出色,成功通过12门学科的评测,成为国内首个跨越这一门槛的大模型。此次考试涵盖了全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学和麻醉学等12个常用学科。

image.png

夸克健康大模型在所有测试科目中均超过了合格线,并在全科医学、肿瘤内科学、皮肤与性病学、精神病学等四个学科达到了主任医师的及格线。这一成绩标志着大模型在医疗领域迈出了从 “知识记忆” 向 “临床推理” 的关键一步,显示了其在医疗辅助决策中的潜力。

与以往国内大模型多停留在初级职称考试阶段不同,夸克健康大模型此次实现了从初级到副高级职称的两级飞跃。该模型基于通义千问,经过海量高质量数据的构建及多阶段的后期训练策略,取得了如此显著的成绩。

在实际应用中,用户通过夸克搜索时会发现,该模型在面对复杂的医疗问题时,能够通过分析后再进行搜索,动态检索相关书籍、指南、药品说明书和医学论文,从而提升了对复杂病例的处理准确性。

具体来看,在初级与中级职称考试中,夸克的成绩领先满血版基础模型约7分和10分,而在副主任医师考试时,夸克的最高领先幅度达到了30分。在长链推理和诊疗路径规划上,夸克的表现也有显著提升。

值得一提的是,在多选题的正确率上,个别基础模型未能超过60%,而夸克借助 “医疗长思考” 机制将正确率提升至71%;在病例分析题中,正确率更是达到了53%。这一成绩的取得离不开夸克健康算法工程师的努力,他们表示,尽管机器通过考试并不意味着可以替代医生,但这显示了机器在辅助诊疗决策、循证检索与患者沟通方面的巨大潜力。

划重点:  

🩺 夸克健康大模型成功通过副主任医师考试,成为国内首个跨越这一门槛的大模型。  

📚 模型在12门学科中均超过合格线,并在4个学科达到主任医师及格线。  

🤖 夸克通过分析与动态检索提升医疗决策的准确性,为医生和患者提供高效的健康管理支持。

相关资讯

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

由哈佛医学院和斯坦福大学组成的科研团队,在医学诊断领域深入评估 OpenAI 的 o1-preview 模型,发现其比人类医生更擅长诊断棘手的医疗案例。
12/25/2024 2:10:43 PM
故渊

沙利文发布权威报告:商汤科技GenAI技术栈市场综合能力位居国内第一

创新实力强、应用落地广,GenAI(生成式AI)技术栈领域,商汤科技位居国内榜首! 近日,权威研究机构弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布《2024年中国GenAI技术栈市场报告》,商汤科技在11个GenAI厂商中超越阿里云、百度智能云和华为云,增长指数和创新指数均排名国内第一,在全球排名中仅次于亚马逊云科技。 报告认为,商汤积极投入技术创新,致力于为用户提供行业领先的自研模型与高性能国产化的推理引擎,同时建立了包含机器与人工审核、安全评测与内容安全策略迭代升级等在内的完整性安全管理方案,是GenAI技术栈领域的领导者。
12/30/2024 4:09:00 PM
新闻助手

全球首个亿级参数量地震波大模型今年对外开放

全球首个亿级参数量地震波大模型“谛听”在国家超级计算机成都中心发布第三阶段测试版本,该大模型 2025 年将开放微调、推理框架和配套的数据处理流程,用户可在超算平台直接使用“谛听”用于业务分析和科学研究。
1/19/2025 1:46:30 PM
归泷(实习)
  • 1