论文部分内容阅读
药物往往通过靶向相应的蛋白来发挥作用。因此,揭示药物和靶标的关系在药物开发中起着至关重要的作用。近年来,药物,靶标蛋白质相互作用(DTIs)的计算预测对于药物发现或药物重定位变得尤为关键。与昂贵且费时的体内或生物学试验相比,计算方法可以有效地识别潜在的DTIs并大大减少候选药物蛋白的范围。所以如何明确可靠的与药物相关的候选蛋白质,是一项值得研究的课题。
本文提出了三种基于深度学习的DTIs预测方法-基于图卷积神经网络和变分自动编码器的药物-靶标相互作用预测方法(简称VGDTI)与基于双重注意力机制的药物-靶标相互作用预测方法(简称AttDTIPred)以及基于随机游走和卷积神经网络的药物-靶标相互作用预测方法(简称DTIPred)。VGDTI首先利用图卷积神经网络学习基于与药物和蛋白有关的相互作用构建的异构网络中的药物和蛋白质节点的拓扑结构表示,并得到一组预测的DTIs得分。同时,通过基于变分自动编码器的模块学习与药物和蛋白质节点间相似性的特征分布,然后,VGDTI再将此分布作为药物蛋白对的特征表示,并预测出另一组潜在的相互作用倾向,最终将两组预测等分加权平均以整合不同的信息作为最终的药物蛋白对存在相互作用的可能性。实验表明,整合与药物和蛋白相关的多源异构数据有助于提升DTIs预测的性能。同时,对clozapine,quetiapine,aripiprazole,amitriptyline和asenapine的案例分析进一步表明了VGDTI可以预测新的药物-蛋白质相互作用。
AttDTIPred是一种基于双重注意力机制整合与药物和蛋白质相关的多种相似性、相互作用、关联的DTIs预测方法。首先,它基于一个基于多层全连接网络和特征级别注意力机制的编码解码框架来分别整合两种药物相似性,蛋白相似性或相互作用,以及药物和蛋白质之间的DTIs,学习药物和蛋白节点的低维向量表示。经过表征以后的药物和蛋白质向量表示作为一个特征序列表示,它们饱含与药物和蛋白有关的特征信息。同时,提出一个基于一维卷积神经网络(1D-CNNs)的预测模块进一步来捕获药物和蛋白节点低维向量表示的抽象信息。然后,在预测DTIs时,也使用了注意力机制把药物的低维序列中的哪些子序列或蛋白质的低维序列中的哪些子序列对DTIs更重要考虑在内。再将经过1D-CNNs模块和注意力机制模块以后的药物和蛋白特征向量表示拼接在一起,作为全连接网络的输入,从而得到我们最终的DTIs预测分值。实验结果表明AttDTIPred与其它的最先进的方法相比获得了更好的预测性能对于药物-靶标蛋白相互作用的预测。此外,对clozapine,quetiapine,aripiprazole,amitriptyline和asenapine的案例分析进一步表明了AttDTIPred具有预测潜在的药物-蛋白质相互作用的能力。
DTIPred通过整合与药物,蛋白相关的多种连接关系,包括药物,蛋白,药物副作用以及它们之间的相似性,相互作用和关联构建药物蛋白异构网络,然后提出这个基于随机游走和卷积神经网络的预测方法,预测潜在的药物-靶标蛋白相互作用。DTIPred既利用了与药物蛋白相关的多种原始特征,又捕获了药物蛋白异构网络的拓扑信息。预测模型由两部分组成,并学习药物-蛋白质对的深层特征表示。模型的左路采用重启随机游走算法来学习药物和蛋白质节点的拓扑向量,通过由卷积神经网络构造的深度学习框架进一步学习拓扑表示。右侧模型聚焦整合与药物蛋白相关的多个原始相似性和相互作用以学习药物蛋白质对的原始表示。交叉验证的实验结果表明DTIPred与其它的最先进的方法相比获得了更好的预测性能对于药物-靶标蛋白相互作用的预测。在验证过程中,DTIPred可以在预测结果的顶部检索到更多实际的药物-蛋白质相互作用,这可能对生物学家有更大的帮助。此外,对五种药物的案例研究进一步证明了DTIPred发现潜在的药物-蛋白质相互作用的能力。
本文提出了三种基于深度学习的DTIs预测方法-基于图卷积神经网络和变分自动编码器的药物-靶标相互作用预测方法(简称VGDTI)与基于双重注意力机制的药物-靶标相互作用预测方法(简称AttDTIPred)以及基于随机游走和卷积神经网络的药物-靶标相互作用预测方法(简称DTIPred)。VGDTI首先利用图卷积神经网络学习基于与药物和蛋白有关的相互作用构建的异构网络中的药物和蛋白质节点的拓扑结构表示,并得到一组预测的DTIs得分。同时,通过基于变分自动编码器的模块学习与药物和蛋白质节点间相似性的特征分布,然后,VGDTI再将此分布作为药物蛋白对的特征表示,并预测出另一组潜在的相互作用倾向,最终将两组预测等分加权平均以整合不同的信息作为最终的药物蛋白对存在相互作用的可能性。实验表明,整合与药物和蛋白相关的多源异构数据有助于提升DTIs预测的性能。同时,对clozapine,quetiapine,aripiprazole,amitriptyline和asenapine的案例分析进一步表明了VGDTI可以预测新的药物-蛋白质相互作用。
AttDTIPred是一种基于双重注意力机制整合与药物和蛋白质相关的多种相似性、相互作用、关联的DTIs预测方法。首先,它基于一个基于多层全连接网络和特征级别注意力机制的编码解码框架来分别整合两种药物相似性,蛋白相似性或相互作用,以及药物和蛋白质之间的DTIs,学习药物和蛋白节点的低维向量表示。经过表征以后的药物和蛋白质向量表示作为一个特征序列表示,它们饱含与药物和蛋白有关的特征信息。同时,提出一个基于一维卷积神经网络(1D-CNNs)的预测模块进一步来捕获药物和蛋白节点低维向量表示的抽象信息。然后,在预测DTIs时,也使用了注意力机制把药物的低维序列中的哪些子序列或蛋白质的低维序列中的哪些子序列对DTIs更重要考虑在内。再将经过1D-CNNs模块和注意力机制模块以后的药物和蛋白特征向量表示拼接在一起,作为全连接网络的输入,从而得到我们最终的DTIs预测分值。实验结果表明AttDTIPred与其它的最先进的方法相比获得了更好的预测性能对于药物-靶标蛋白相互作用的预测。此外,对clozapine,quetiapine,aripiprazole,amitriptyline和asenapine的案例分析进一步表明了AttDTIPred具有预测潜在的药物-蛋白质相互作用的能力。
DTIPred通过整合与药物,蛋白相关的多种连接关系,包括药物,蛋白,药物副作用以及它们之间的相似性,相互作用和关联构建药物蛋白异构网络,然后提出这个基于随机游走和卷积神经网络的预测方法,预测潜在的药物-靶标蛋白相互作用。DTIPred既利用了与药物蛋白相关的多种原始特征,又捕获了药物蛋白异构网络的拓扑信息。预测模型由两部分组成,并学习药物-蛋白质对的深层特征表示。模型的左路采用重启随机游走算法来学习药物和蛋白质节点的拓扑向量,通过由卷积神经网络构造的深度学习框架进一步学习拓扑表示。右侧模型聚焦整合与药物蛋白相关的多个原始相似性和相互作用以学习药物蛋白质对的原始表示。交叉验证的实验结果表明DTIPred与其它的最先进的方法相比获得了更好的预测性能对于药物-靶标蛋白相互作用的预测。在验证过程中,DTIPred可以在预测结果的顶部检索到更多实际的药物-蛋白质相互作用,这可能对生物学家有更大的帮助。此外,对五种药物的案例研究进一步证明了DTIPred发现潜在的药物-蛋白质相互作用的能力。