AIGC宇宙 AIGC宇宙

图神经网络准确预测无机化合物性质,加速固态电池的设计

作者:ScienceAI
2021-12-24 11:19
编辑/绿萝大规模从头计算与结构预测的进步相结合,在无机功能材料的发现中发挥了重要作用。目前,在无机材料的广阔化学空间中,只发现了一小部分。实验和计算研究人员都需要加速探索未知的化学空间。来自美国国家可再生能源实验室(NREL)、科罗拉多矿业学院和伊利诺伊大学的研究人员展示了一种可以准确预测无机化合物性质的机器学习方法。展示了基态(GS)和更高能量结构的平衡训练数据集,对使用通用图神经网络(GNN)架构准确预测总能量的重要性。该研究可加速固态电池的设计。该研究以「Predicting energy and stabi

编辑/绿萝

大规模从头计算与结构预测的进步相结合,在无机功能材料的发现中发挥了重要作用。目前,在无机材料的广阔化学空间中,只发现了一小部分。实验和计算研究人员都需要加速探索未知的化学空间。

来自美国国家可再生能源实验室(NREL)、科罗拉多矿业学院和伊利诺伊大学的研究人员展示了一种可以准确预测无机化合物性质的机器学习方法。展示了基态(GS)和更高能量结构的平衡训练数据集,对使用通用图神经网络(GNN)架构准确预测总能量的重要性。该研究可加速固态电池的设计。

该研究以「Predicting energy and stability of known and hypothetical crystals using graph neural network」为题,发表在《Patterns》杂志上。

图神经网络准确预测无机化合物性质,加速固态电池的设计

晶体内部结构中的原子有规则地在三维空间呈周期性重复排列。测量这些晶体结构稳定性的一种方法是计算它们的总能量——较低的总能量转化为较高的稳定性。单一化合物可以具有许多不同的晶体结构。为了找到能量最低的结构:基态结构。研究人员依赖于计算成本高昂的高保真数值模拟。

如果在电极和电解质之间的界面形成竞争相,固态电池会失去容量和电压。寻找相容的材料,确保材料不会分解。但候选的领域很广:估计表明有数百万甚至数十亿种似是而非的固态化合物等待被发现。

「你无法对这个潜在晶体结构空间的大片区域进行这些非常详细的模拟。」NREL 研究员 Peter St. John说。「每个都是非常密集的计算,在大型计算机上需要几分钟到几小时。」 然后,人类必须梳理所得数据,以手动识别新的预期材料。

为了加速这一过程,研究人员使用了一种称为图神经网络的机器学习形式。图神经网络是一种经过训练可以检测和突出显示数据模式的算法。在这里,「图」本质上是每个晶体结构的图。该算法分析每个晶体结构,然后预测其总能量。

对于基准测试,研究人员在来自 NREL 材料数据库 (NRELMatDB) 的 ICSD(无机晶体结构数据库) 结构的 DFT 总能量上训练 CGCNN 模型。该模型在 15,500 个晶体结构上进行了训练,每个结构都保留了 其中 500 个用于验证和测试。

图神经网络准确预测无机化合物性质,加速固态电池的设计

GNN 模型架构。

然而,任何神经网络的成功都取决于其用来学习的数据。科学家们已经确定了超过 200,000 种无机晶体结构,但还有很多的可能性。一些晶体结构起初看起来很稳定——直到与较低能量的化合物进行比较才会发现并非如此。研究人员提出了假设的、更高能量的晶体,可以帮助机器学习模型提高分辨看似稳定的结构和实际稳定结构的能力。

「要训练一个能够正确预测结构是否稳定的模型,你不能只给它提供我们已经知道的基态结构。你必须给它这些假设的高能结构,这样模型才能区分这两者,」St. John说。

为了训练他们的图神经网络,研究人员创建了基于量子力学计算而不是自然的理论示例。通过在训练数据中同时包含基态和高能晶体,与仅在基态结构上训练的模型相比,研究人员能够获得更准确的结果。研究人员模型的平均误差比对比案例低五倍。

具体而言,研究人员使用 Kendall 等级相关系数 (KRCC) 作为度量来比较不同模型和数据集之间预测能量等级的准确性。

当在相同的组合数据集上训练时,GNN 模型、MEGNet 和 CGCNN 模型具有相似的平均 KRCC。与仅在 ICSD 结构上训练相同模型相比,这是 KRCC 的显着改进。因此,训练数据的选择起着更关键的作用,而实际模型架构对模型在结构能量排名中的性能影响较小。

图神经网络准确预测无机化合物性质,加速固态电池的设计

不同数据集和模型的能源排名比较。

这种方法可以彻底改变研究人员发现具有宝贵特性的新材料的速度,使他们能够快速地发现最有前途的晶体结构。科罗拉多矿业学院的研究教授 Gorai 说,这项工作具有广泛的相关性。

「两种固体相互接触的情况发生在许多不同的应用中——光伏、热电、各种功能设备。」Gorai 说。「一旦该模型成功,它就可以部署在固态电池之外的许多应用中。」

论文链接:https://doi.org/10.1016/j.patter.2021.100361

参考内容:https://techxplore.com/news/2021-12-machine-method-battery-materials.html

相关标签:

相关资讯

苹果研究人员质疑 AI 的推理能力:简单数学问题稍作改动就会答错

近年来,人工智能(AI)在各个领域取得了显著的进展,其中大型语言模型(LLM)能够生成人类水平的文本,甚至在某些任务上超越人类的表现。然而,研究人员对 LLM 的推理能力提出了质疑,他们发现这些模型在解决简单的数学问题时,只要稍加改动,就会犯错误,这表明它们可能并不具备真正的逻辑推理能力。图源 Pexels周四,苹果公司的一组研究人员发布了一篇名为《理解大型语言模型中数学推理的局限性》的论文,揭示 LLM 在解决数学问题时容易受到干扰。
10/12/2024 8:51:38 AM
远洋

OpenAI GPT-4 AI 模型潜力挖掘:高精度建模基础蛋白质结构

科技媒体 The Decoder 昨日(8 月 21 日)发布博文,报道称罗格斯大学的一项研究表明,OpenAI 公司的 GPT-4 语言模型能高精度模拟简单的氨基酸和蛋白质结构。相关研究成果发表在《Scientific Reports》上,该科研团队使用 GPT-4 AI 语言模型,探索其在基本结构生物学任务中的表现,结果发现该 AI 模型可以准确预测分子结构。科学家们要求 GPT-4 建立 20 种标准氨基酸的三维结构模型,在反馈结果中准确地预测了原子组成、键长和角度,不过 GPT-4 在模拟环状结构和立体化学
8/22/2024 8:40:27 AM
故渊

Llama都在用的RoPE有了视频版,复旦上海AI Lab等提出长视频理解/检索绝佳拍档

Llama都在用的RoPE(旋转位置嵌入)被扩展到视频领域,长视频理解和检索更强了。 复旦大学、上海AI实验室等提出VideoRoPE,并确定了将RoPE有效应用于视频所需的四个关键特性。 在长视频检索、视频理解和视频幻觉等各种下游任务中,VideoRoPE始终优于先前的RoPE变体。
2/19/2025 11:28:00 AM
  • 1