从摩根指纹中获取结构,RDKit



我制作了一个模型,根据分子的morgan指纹预测分子的溶解度,现在我发现了模型很难预测的指纹的具体部分。我想看看指纹的每一点在分子结构上与什么相关,多亏了用户的帮助,我找到了DrawMorganBits,但这里我需要分子的摩尔(或Smiles(,而我只有非特异性分子的指纹。

有没有可能从指纹中获得摩尔或微笑的代码,或者我可以用其他方式用指纹绘制结构?

提前谢谢。

您可以使用RDKit博客中描述的DrawMorganBit()

如果你只有一个分子指纹,很难追踪到导致每个位被设置的子结构,甚至可能不可能,这取决于你使用的指纹。

在上述RDKit博客中,bitInfodict正在捕获负责在"0"之前设置比特的子结构;折叠"/"散列";指纹。哈希过程会导致比特冲突,因此如果没有这个字典,就不可能确定地映射回来。


如果你有意志力,并且确实不可能跟踪bitInfo,你可以尝试生成设置你感兴趣的位的结构(或随机采样结构(,这将允许你猜测哪些子结构可能最初是负责的。

一个起点可能是GuacaMol基准代码库,它包括可以从指纹中生成分子的任务和基线方法。

最新更新