今日应用
今日话题
数百万晶体数据训练、解决晶体学相位问题,深度学习方法PhAI登Science
文章摘要
摘要:
晶体学作为自然科学的核心分析技术之一,其在测定晶体结构方面具有无可比拟的优势。然而,晶体学中的相位问题一直是研究的难点,因为实验中只能获得振幅信息,而相位信息会丢失。丹麦哥本哈根大学的研究人员通过开发一种名为PhAI的深度学习方法,成功解决了这一问题。
PhAI神经网络通过训练数百万人工晶体结构及其合成衍射数据,能够接受结构因子振幅并输出相应的相位值。研究表明,PhAI能够在仅2埃的分辨率下解决相位问题,这一分辨率仅相当于原子分辨率可用数据的10%到20%,而传统的从头算方法通常需要原子分辨率。
PhAI神经网络的架构包括卷积输入块、卷积块(Conv3D)和多层感知器(MLP)块,以及线性分类器(相位分类器)。训练数据是通过将GDB-13数据库中的金属原子和有机分子插入到晶胞中生成的。经过训练的神经网络在标准计算机上运行,计算需求适中,能够即时预测并输出相位值。
研究人员使用计算得出的真实晶体结构的衍射数据测试了神经网络的性能,共获得2387个测试用例。结果表明,PhAI能够解决所有测试结构,并且在从低分辨率数据中解决结构方面表现出色。尽管神经网络几乎没有针对无机结构进行训练,但它仍然能够完美地解决此类结构。
与传统的电荷翻转方法相比,PhAI在处理高分辨率数据时表现优异,并且随着数据分辨率的降低,其产生合理正确解的能力逐渐下降。这一结果表明,在晶体学中必须有原子分辨率数据才能从头算相位的普遍观念可能被打破。PhAI仅需要10%至20%的原子分辨率数据。
然而,这种深度学习方法的挑战在于扩展神经网络,较大晶胞的衍射数据将需要大量的输入和输出数据以及训练期间的计算成本。未来,需要进一步研究,将该方法扩展到一般情况。
PhAI的成功开发为晶体学研究提供了新的途径,也为基于深度学习的结构测定开辟了新的可能性。这一成果不仅对晶体学领域具有重要意义,也为人工智能与其他前沿技术及基础科学的交叉研究与融合发展提供了新的视角。
阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。
文章来源
原文地址: 点我阅读全文
原文作者: 机器之心