今日应用
今日话题
准确率达60.8%,浙大基于Transformer的化学逆合成预测模型,登Nature子刊
重点标签 逆合成预测、AI应用、EditRetro模型、化学合成、浙江大学
文章摘要
EditRetro 模型通过其非自回归解码器提高了生成效率,能够在每个解码器内并行执行编辑操作。当给定一个目标分子时,编码器将其字符串作为输入并生成相应的隐藏表示,然后将其用作解码器交叉注意模块的输入。解码器也在第一次迭代时将产品字符串作为输入,在每次解码迭代期间,三个解码器依次执行。研究人员在公共基准数据集 USPTO-50K 和 USPTO-FULL 上评估了所提方法,EditRetro 在预测准确度方面优于其他基线,包括最先进的基于序列的方法 R-SMILES 和基于图编辑的方法 Graph2Edits。在 USPTO-50K 数据集上,EditRetro 的 top-1 精确匹配准确率达到 60.8%,在 USPTO-FULL 数据集上达到 52.2%,证明了其在更多样化和更具挑战性的化学反应中的有效性。
EditRetro 通过精心设计的推理模块提供多样化的预测。该模块结合了重新定位采样和序列增强,有助于生成多样化和变化的预测。重新定位采样对重新定位动作的预测进行采样,从而能够识别不同的反应位点。序列增强从不同的产品变体到反应物生成不同的编辑途径,从而提高了预测的准确性和多样性。这两种策略共同作用,提高了预测的准确性和多样性。
进一步的实验验证了 EditRetro 在一些更复杂的反应中的优越性,包括手性、开环和成环反应。结果证实了 EditRetro 在这些具有挑战性的场景中的优越性,证明了它能够处理不同类型的化学转化。
EditRetro 在四个多步骤逆合成规划场景中的成功应用证明了其实用性。研究人员选择了四种具有重要药用价值的目标化合物进行评估:非布司他、奥希替尼、GPX4 的变构激活剂和 DDR1 激酶抑制剂 INS015_037。所有四个示例都产生了与文献中报道的途径非常一致的逆合成途径,大多数预测排名在前两位。在考虑的 16 个单独步骤中,有 10 个步骤的预测准确率为 1。这些结果证明了 EditRetro 在实际逆合成预测中的实际潜力,有望在逆合成规划领域得到实际应用。
文章来源
原文地址: 点我阅读全文
原文作者: 机器之心