AIGC宇宙 AIGC宇宙

​国内首个!夸克健康大模型成功通过副主任医师考试

夸克健康大模型在全国副主任医师职称考试中表现出色,成功通过12门学科的评测,成为国内首个跨越这一门槛的大模型。 此次考试涵盖了全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学和麻醉学等12个常用学科。 夸克健康大模型在所有测试科目中均超过了合格线,并在全科医学、肿瘤内科学、皮肤与性病学、精神病学等四个学科达到了主任医师的及格线。

夸克健康大模型在全国副主任医师职称考试中表现出色,成功通过12门学科的评测,成为国内首个跨越这一门槛的大模型。此次考试涵盖了全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学和麻醉学等12个常用学科。

image.png

夸克健康大模型在所有测试科目中均超过了合格线,并在全科医学、肿瘤内科学、皮肤与性病学、精神病学等四个学科达到了主任医师的及格线。这一成绩标志着大模型在医疗领域迈出了从 “知识记忆” 向 “临床推理” 的关键一步,显示了其在医疗辅助决策中的潜力。

与以往国内大模型多停留在初级职称考试阶段不同,夸克健康大模型此次实现了从初级到副高级职称的两级飞跃。该模型基于通义千问,经过海量高质量数据的构建及多阶段的后期训练策略,取得了如此显著的成绩。

在实际应用中,用户通过夸克搜索时会发现,该模型在面对复杂的医疗问题时,能够通过分析后再进行搜索,动态检索相关书籍、指南、药品说明书和医学论文,从而提升了对复杂病例的处理准确性。

具体来看,在初级与中级职称考试中,夸克的成绩领先满血版基础模型约7分和10分,而在副主任医师考试时,夸克的最高领先幅度达到了30分。在长链推理和诊疗路径规划上,夸克的表现也有显著提升。

值得一提的是,在多选题的正确率上,个别基础模型未能超过60%,而夸克借助 “医疗长思考” 机制将正确率提升至71%;在病例分析题中,正确率更是达到了53%。这一成绩的取得离不开夸克健康算法工程师的努力,他们表示,尽管机器通过考试并不意味着可以替代医生,但这显示了机器在辅助诊疗决策、循证检索与患者沟通方面的巨大潜力。

划重点:  

🩺 夸克健康大模型成功通过副主任医师考试,成为国内首个跨越这一门槛的大模型。  

📚 模型在12门学科中均超过合格线,并在4个学科达到主任医师及格线。  

🤖 夸克通过分析与动态检索提升医疗决策的准确性,为医生和患者提供高效的健康管理支持。

相关资讯

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云宣布完成对深度求索(DeepSeek)大模型的深度整合——正式上线DeepSeek-R1和V3原版模型的API接口,并创新性接入自研大模型知识引擎,同步开放联网搜索能力。 凭借腾讯云在推理并发和生成速率等方面的优化,用户可以获得更加稳定、安全、低门槛的使用体验。 开发者只需在云上简单三步即可实现API接口调用,并通过大模型知识引擎提供的文档解析、拆分、embedding、多轮改写等能力,灵活构建专属的AI服务。
2/8/2025 2:09:00 PM
AI在线

微信搜索接入DeepSeek大模型 称AI不会使用朋友圈聊天等信息

近日,微信宣布其搜索功能接入 DeepSeek-R1模型,目前处于灰度测试阶段。 部分用户在微信搜索框选择 AI 搜索时,可体验到 DeepSeek-R1提供的深度思考功能。 微信方面表示,引入大模型旨在提升搜索的智能化和精准度,更好地理解用户搜索意图,分析处理复杂查询。
2/19/2025 11:18:00 AM
AI在线

DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型

今日凌晨,全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布,DeepSeek-R1在 Hugging Face 上获得了超过10000个赞,成为该平台近150万个模型中最受欢迎的大模型。 这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。
2/24/2025 9:30:00 AM
AI在线
testab