本文先容了关嘉麒&Wesley Wei Qian团队颁发在ICLR 2022的文章《ENERGY-INSPIRED MOLECULAR CONFORMATION OPTIMIZATION》。作者研讨若何猜测份子的空间原子排列或份子构象,提出了一个神经能量最小化的概念。他将猜测题目归结为一个展开的优化进程,并将神经收集参数化来进修隐式构象能量场的梯度空间。假定底层势能有分歧的函数表达式,作者可以重新诠释并同一很多现有的模子,还可以有原则地推导出SE(3)-equivariant神经收集的新变体。 1.先容3D份子构象是决议份子很多物理化学和生物特征的最重要的特征之一。在斟酌化学反应和相互感化的空间约束或电子效应时,份子的3D电荷散布和物理外形相当重要。是以,份子构象被普遍利用在定量结构活性关系(QSAR)评价和药物发现中。随着对虚拟药物挑选和de novo 药物设想的关注过活益进步,今朝更需要快速正确地猜测份子构象以获得其3D 多少特征。 比来,深度进修技术被引入来处理而且获得了理想的成果。例如,天生模子被提出首天赋生原子对的配对间隔,然后从这类矩阵中推导出构象体。由于3D结构是间接天生的,所以第二步中对于估量间隔的误差很敏感,能够需要额外的模子来编码冗余量。与此同时,出现了很多SE(3)-equivariant收集来处置3D扭转对称的输入,使其可以间接操纵三维笛卡尔坐标。比来这类模子最成功的利用是用于卵白质结构猜测的AlphaFold系统。虽然有很多益处,但是现有的SE(3)-equivariant收集要末来自需要高贵系数计较的复杂数学理论,要末是基于消息传递直觉的启发式计较。 作者提出了一种全新的方式,将份子构象猜测展开为牢固数目的优化步调,其中神经收集被参数化来进修隐式构象能量场的梯度空间。在此方式中,该模子可以将一个给定的构象体向更稳定和能量优先的状态去优化。作者不但可以重新诠释现有模子,而且可以从构象能量函数的假定中推导出SE(3)-equivariant模子的新变体,使得模子的结构与其物理假定连结分歧。经过尝试发现,这些新变体与别的SE(3)等模子相比,在构象体优化方面的性能表示更好。此外,作者提出的优化方式也适用于构象体的天生,可以天生多样且正确的构象体。 此论文的首要进献包括:
2.方式份子构象代表了原子的3D排列,与构象能量联系慎密。由于份子构象的每个平衡点都可以被视为势能概况的部分最小值。是以可以经过梯度下降找到这些稳定结构,由于这是一个能量最小化的进程。具体地,给定一个特定的能量函数E,可以经过梯度下降更新3D直角坐标来优化构象体X,使得E最小化: 其中γ是进修率,我们可以观察到 为一个稳定结构。是以,假如能量函数E(X|)是完全表征的且对X可微,我们可以经过迭代利用梯度下降来更新,很轻易地从初始构象体中找到一个稳定的份子构象。不幸的是,情况凡是不是这样。 作者操纵神经收集的计较才能,让它间接从数据中进修梯度场,而不是手工设想能量函数及其梯度。一旦收集被练习,便可以用该模子展开优化,并履行上述优化的神经版本,其中公式1中的梯度项E不是来自显式能量函数,而是由神经收集估量的。 对于一切∈X,∈和∈,其中φ是估量各自梯度场的神经收集,神经收集的切确参数将取决于能量函数。在这项工作中,为了简单起见,作者将视为一个常数暗示,是以它在作者的模子中没有更新。 3.成果3.1份子构象优化如表1所示,一切的优化模子都可以改良由RDKit+MMFF估量的初始构象。重新框架中获得的新变体也明显优于两个最早辈的SE(3)-equivariant模子。 如图2所示,作者的模子可以发生既现实而且能量稳定的结构体。在没有决心设想的情况下,作者的模子猜测的构象体也能很好地捕捉到根基成份的结构(例如,苯在同一平面上构成一个环)。对于初始构象体(RDKit+MMFF)没有以最稳定方式折叠/扭转的大份子,作者的模子也可以将构象体优化到稳定状态后来作为参考构象体。 如图3所示,可以发现由作者的模子猜测的构象计较出的HOMO-LUMO间隙与参考构象符合杰出,而参考构象与力场优化构象之间的相关性却要低很多。在第二项研讨中,作者针对QM9基准,用参考或猜测的构象练习了一个标准的神经收集模子SchNet。如表2所示,用作者猜测的构象体练习的模子优于别的猜测构象体练习的模子。 3.2份子构象天生如表3所示,作者的模子在一切的目标上的表示都很有合作力,出格是在更具应战性的GEOM-QM9药物数据集上,本模子跨越了一切的机械进修方式。这些成果表白,作者的优化公式可以很轻易地推行到多样化且正确的构象调集的天生设备中。 4.总结和会商本文提出了一种新的份子构象猜测公式,经过参数化一个SE(3)-equivariant收集来模拟构象能量景观的梯度场。经过将SE(3)-equivariant模子与潜伏的能量函数联系起来,作者还发现了一个新的视角,首要推导出SE(3)-equivariant模子的新变体,该模子与物理系统的一组明白的根基假定相分歧。经过大量的尝试,作者证实了所提出的方式可以优化一个给定的构象到其最能量稳定的状态,并有用地天生一个分歧的和正确的构象的调集。这类受能量启发的视角也为思考SE(3)-equivariant模子供给了一个新的偏向,并期望社区经过更合适其利用的能量假定得出更风趣的变体。 对于未来的工作,作者的爱好也超越了小份子的构象,由于作者可以进一步扩大系统范围来模拟更大的生物份子系统,如卵白质-配体复合物。此外,摸索像DEQ这样对平衡状态间接建模的模子也是很风趣的。由于作者的练习方针对手性是自觉标,系统将需要在模子天生后揣度手性,而作者能否构建内置手性的系统仍然是一个风趣的题目。最初,由于具有快速天生高质量份子构象集成的才能,作者也对利用构象集成的份子机械进修很感爱好。 参考材料Guan, J., Qian, W.W., Ma, W.Y., Ma, J. and Peng, J., 2021, September. Neural Energy Minimization for Molecular Conformation Optimization. In International Conference on Learning Representations. 代码https://github.com/guanjq/confopt_official |