deepchem&rdkit | seq2seq自动编码器生成新分子

自编码结构

本文介绍了一种将分子的离散表示转化为和的方法从多维连续表示。这个模型允许我们生成新的分子以进行有效的探索和优化化合物的开放空间。对一个seq2seq神经网络进行训练现有数十万种化学结构要构建三个耦合函数:一个编码器、一个解码器和一个预测器。编码器将分子的离散表示转换为实数连续向量,解码器将这些连续向量转换回离散的分子表征。预测器估计化学物质分子的潜在连续向量表示的性质。分子的连续表示使我们能够通过在潜在空间中进行简单的操作比如解码随机向量,扰乱已知化学结构,或者分子之间的插值自动生成新颖的化学结构。连续表示也允许使用强大的基于梯度的优化,有效的引导搜索优化功能的化合物。

在这里插入图片描述

导入deepchem实现

# Train a variational autoencoder to generate molecules.  First load
# the training data.

猜你喜欢

转载自blog.csdn.net/weixin_43236007/article/details/111937959
今日推荐