AIGC宇宙 AIGC宇宙

​前谷歌 CEO 投资的初创公司发布240亿参数化学推理模型,准确率超越多种领先模型

在人工智能领域,大模型的研究不断进展,尤其是在推理能力的提升上。 最近,由前谷歌 CEO 埃里克・施密特投资的初创公司 FutureHouse,开源了一个名为 ether0的化学任务推理模型,参数规模高达240亿。 这一模型在不需要额外领域预训练的情况下,通过后训练技术,展现出强大的化学领域能力,尤其是在数据需求上相比于传统领域专用模型显著减少。

在人工智能领域,大模型的研究不断进展,尤其是在推理能力的提升上。最近,由前谷歌 CEO 埃里克・施密特投资的初创公司 FutureHouse,开源了一个名为 ether0的化学任务推理模型,参数规模高达240亿。这一模型在不需要额外领域预训练的情况下,通过后训练技术,展现出强大的化学领域能力,尤其是在数据需求上相比于传统领域专用模型显著减少。

推理模型的应用不仅限于简单的选择题测试,FutureHouse 团队希望通过 ether0改变这种现状,推动科学推理的深入研究。为了构建该模型,研究团队从大量的学术论文中整理了化学实验数据,追踪分子特性如溶解度和气味,并将这些数据转化为可验证的科学问题。

image.png

ether0基于 Mistral-Small-24B 架构,利用强化学习进行训练,并处理了640,730个实验数据相关的化学问题,涵盖18类任务,包括合成可行性、血脑屏障渗透性和气味分析等。为了提升模型性能,研究团队引入了推理行为蒸馏和动态课程学习等技术。

在性能评估方面,ether0与多种通用大语言模型(如 Claude、o1)及化学专用模型(如 ChemDFM、TxGemma)进行了对比。结果显示,ether0在开放答案(OA)类别中准确率最高,选择题(MCQ)方面也具备强大的竞争力。其在某些任务上的准确率甚至达到了竞争对手的两倍以上。

此外,ether0在训练成本上也展现出显著的优势,要达到相似的反应预测准确率,传统的非推理型模型需要消耗50倍以上的数据。尽管 ether0在独立基准测试中难以与其他模型及人类表现进行交叉验证,但其能够对未经过训练的分子结构进行有效推理。

总之,ether0不仅能理解自然语言提问,还能通过自然语言进行推理,最终生成分子结构,特别擅长于类药分子的设计。尽管目前仍处于原型阶段,但其已为未来构建通用科学推理模型奠定了坚实的基础。

划重点:  

🌟 Ether0是由 FutureHouse 开源的240亿参数化学推理模型。  

📈 该模型的准确率在多个任务中超越了 GPT-4.1和 DeepSeek-R1等领先模型。  

💰 训练 ether0所需的数据量显著低于传统非推理型模型。

相关资讯

沙利文发布权威报告:商汤科技GenAI技术栈市场综合能力位居国内第一

创新实力强、应用落地广,GenAI(生成式AI)技术栈领域,商汤科技位居国内榜首! 近日,权威研究机构弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布《2024年中国GenAI技术栈市场报告》,商汤科技在11个GenAI厂商中超越阿里云、百度智能云和华为云,增长指数和创新指数均排名国内第一,在全球排名中仅次于亚马逊云科技。 报告认为,商汤积极投入技术创新,致力于为用户提供行业领先的自研模型与高性能国产化的推理引擎,同时建立了包含机器与人工审核、安全评测与内容安全策略迭代升级等在内的完整性安全管理方案,是GenAI技术栈领域的领导者。
12/30/2024 4:09:00 PM
新闻助手

全球首个亿级参数量地震波大模型今年对外开放

全球首个亿级参数量地震波大模型“谛听”在国家超级计算机成都中心发布第三阶段测试版本,该大模型 2025 年将开放微调、推理框架和配套的数据处理流程,用户可在超算平台直接使用“谛听”用于业务分析和科学研究。
1/19/2025 1:46:30 PM
归泷(实习)

豆包推出实时语音大模型:号称中文对话断崖式领先、情商智商均在线

据介绍,豆包实时语音大模型实现了语音理解和生成一体化,实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。
1/20/2025 4:29:51 PM
清源
  • 1