基于深度学习的药物相关靶标预测研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:yd126523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物往往通过靶向相应的蛋白来发挥作用。因此,揭示药物和靶标的关系在药物开发中起着至关重要的作用。近年来,药物,靶标蛋白质相互作用(DTIs)的计算预测对于药物发现或药物重定位变得尤为关键。与昂贵且费时的体内或生物学试验相比,计算方法可以有效地识别潜在的DTIs并大大减少候选药物蛋白的范围。所以如何明确可靠的与药物相关的候选蛋白质,是一项值得研究的课题。
  本文提出了三种基于深度学习的DTIs预测方法-基于图卷积神经网络和变分自动编码器的药物-靶标相互作用预测方法(简称VGDTI)与基于双重注意力机制的药物-靶标相互作用预测方法(简称AttDTIPred)以及基于随机游走和卷积神经网络的药物-靶标相互作用预测方法(简称DTIPred)。VGDTI首先利用图卷积神经网络学习基于与药物和蛋白有关的相互作用构建的异构网络中的药物和蛋白质节点的拓扑结构表示,并得到一组预测的DTIs得分。同时,通过基于变分自动编码器的模块学习与药物和蛋白质节点间相似性的特征分布,然后,VGDTI再将此分布作为药物蛋白对的特征表示,并预测出另一组潜在的相互作用倾向,最终将两组预测等分加权平均以整合不同的信息作为最终的药物蛋白对存在相互作用的可能性。实验表明,整合与药物和蛋白相关的多源异构数据有助于提升DTIs预测的性能。同时,对clozapine,quetiapine,aripiprazole,amitriptyline和asenapine的案例分析进一步表明了VGDTI可以预测新的药物-蛋白质相互作用。
  AttDTIPred是一种基于双重注意力机制整合与药物和蛋白质相关的多种相似性、相互作用、关联的DTIs预测方法。首先,它基于一个基于多层全连接网络和特征级别注意力机制的编码解码框架来分别整合两种药物相似性,蛋白相似性或相互作用,以及药物和蛋白质之间的DTIs,学习药物和蛋白节点的低维向量表示。经过表征以后的药物和蛋白质向量表示作为一个特征序列表示,它们饱含与药物和蛋白有关的特征信息。同时,提出一个基于一维卷积神经网络(1D-CNNs)的预测模块进一步来捕获药物和蛋白节点低维向量表示的抽象信息。然后,在预测DTIs时,也使用了注意力机制把药物的低维序列中的哪些子序列或蛋白质的低维序列中的哪些子序列对DTIs更重要考虑在内。再将经过1D-CNNs模块和注意力机制模块以后的药物和蛋白特征向量表示拼接在一起,作为全连接网络的输入,从而得到我们最终的DTIs预测分值。实验结果表明AttDTIPred与其它的最先进的方法相比获得了更好的预测性能对于药物-靶标蛋白相互作用的预测。此外,对clozapine,quetiapine,aripiprazole,amitriptyline和asenapine的案例分析进一步表明了AttDTIPred具有预测潜在的药物-蛋白质相互作用的能力。
  DTIPred通过整合与药物,蛋白相关的多种连接关系,包括药物,蛋白,药物副作用以及它们之间的相似性,相互作用和关联构建药物蛋白异构网络,然后提出这个基于随机游走和卷积神经网络的预测方法,预测潜在的药物-靶标蛋白相互作用。DTIPred既利用了与药物蛋白相关的多种原始特征,又捕获了药物蛋白异构网络的拓扑信息。预测模型由两部分组成,并学习药物-蛋白质对的深层特征表示。模型的左路采用重启随机游走算法来学习药物和蛋白质节点的拓扑向量,通过由卷积神经网络构造的深度学习框架进一步学习拓扑表示。右侧模型聚焦整合与药物蛋白相关的多个原始相似性和相互作用以学习药物蛋白质对的原始表示。交叉验证的实验结果表明DTIPred与其它的最先进的方法相比获得了更好的预测性能对于药物-靶标蛋白相互作用的预测。在验证过程中,DTIPred可以在预测结果的顶部检索到更多实际的药物-蛋白质相互作用,这可能对生物学家有更大的帮助。此外,对五种药物的案例研究进一步证明了DTIPred发现潜在的药物-蛋白质相互作用的能力。
其他文献
伴随着移动互联网和大数据的高速发展,互联网产生大量的数据,这些海量的数据在给我们带来丰富选择的同时,也给我们带来了信息过载的问题。推荐系统旨在根据用户和项目之间的交互历史来自动构架用户和项目的之间的联系。学术和工业界的研究表明,推荐系统能够有效解决信息过载问题,提升数据的利用率。然而传统的推荐算法受限于有限的附属信息和模型结构,无法实现理想的效果,而且非常容易受到数据稀疏的影响,尤其是冷启动问题。
学位
睡眠是一种复杂的生理活动过程,充足的睡眠时间和高质量的睡眠质量是人体生理健康和心理健康的必要条件。睡眠障碍严重影响人类健康和生活,将睡眠阶段准确的分类是检测和治疗睡眠障碍的关键,睡眠阶段分类也称之为睡眠分期。在睡眠分期领域,主流的深度学习方法在同一层次上仅仅使用了某种单一的关系归纳偏置,这会使得深度学习方法的特征提取方式不够完备并导致该方法的性能受到限制。本文使用平移不变性、时间不变性和分层处理等
学位
开发一种治疗疾病的新药是一种非常漫长和昂贵的过程,为已知药物确定新的疾病适应症,即药物重定位,有助于减少药物的研发成本。目前,大多预测药物相关疾病的方法都是综合利用与药物和疾病相关的数据。然而这些方法虽然聚焦在整合多种药物特征,并没有考虑到各种特征间的多样性。此外这些方法尽管利用了药物和疾病相关的各种数据,但是它们都是根据浅层模型提出的,很难挖掘出药物和疾病之间复杂的关联关系。这些不足将在一定程度
随着社会的进步,移动互联网已经涉及到各行各业,移动电商和基于位置的社交网络(LBSN,Location-Based Social Networks)也得到了迅猛的发展,如淘宝,京东,Facebook,Twitter,Foursquare,Gowalla,Yelp等。与此同时,诸如信息爆炸问题也日益受到人们的关注,如何从逐日爆炸性增长的互联网海量数据中提取出对用户有实际意义的信息,同时尽可能地过滤不
学位
由于户外环境的复杂多变,如雨雾天气、低光照、噪声等,图像采集设备收集到的图像常会受到不同程度的损坏。图像的退化不仅会降低可视化效果,而且会影响下游的目标识别等高级视觉任务。低质量图像恢复旨在从退化图像中恢复高质量图像信号,传统的图像恢复方法主要利用局部或非局部的图像特征,缺乏深层次的语义信息,限制了在复杂场景中的特征表示能力。近年来,基于卷积神经网络(CNN)的方法能够同时提取浅层和深层特征,在图
电子病历(Electronic Medical Record,EMR)是使用计算机记录病人治疗情况的一种形式,它记录了病人所有的诊断治疗信息,比如现病史、既往史等,这些信息具有极高的医学价值。随着人工智能、自然语言处理技术的成熟落地和成功应用,各个领域开始借助这些技术在不断的更新和进步,如,在医学领域,使用EMR辅助医生决策,提高疾病诊断性能已经成为了至关重要的任务。但是,之前的工作仅仅使用卷积神
学位
随着计算机技术的发展,以深度学习为代表的方法为医疗图像的研究与发展开拓了新的方向。由于视网膜血管与糖尿病、高血压、心脑血管等疾病的重要联系,研究人员对自动分割视网膜血管这一医学任务也给予重要关注。在目前大多数基于深度学习的视网膜血管分割方法中,以编码-解码结构的分割模型融合了视网膜图像的全局和局部信息,在分割性能上取得了突破性的发展。但由于视网膜血管复杂的形态变化、病变区域的影响、毛细血管的分支多
学位
在过去几年里,尽管立场检测研究取得了很大的进展,但是现有的立场检测工作大多只关注训练集和测试集分布一致的情况,却忽略了社交平台话题的特点,即较快的更新速度。处理新兴的陌生话题领域也因此变得极为重要。为此,本文使用了深度神经网络作为基础模型来探索立场检测任务处理未知话题的方法。具体地,本文将从以下三个方面展开探索:(1)基于领域泛化的未知目标立场检测方法:本文将未知目标立场检测任务看作分类任务,首先
学位
近年来计算机断层扫描技术(CT)被广泛用于临床诊断,由于CT会产生较高的辐射,危害人体健康,医学界通常采用低剂量CT扫描技术(LDCT)来获取CT图像。尽管LDCT能够有效降低辐射量,但是LDCT图像容易引入更多噪声和伪影,最终可能影响放射科医生的诊断。由于CT原始数据难以获取,大量研究聚焦于直接对CT图像进行后处理去噪。现有CT图像去噪算法主要针对特定剂量的CT图像,且存在去噪后图像细节丢失、图
学位
随着网络优化,普适计算和物联网的快速发展,室内定位技术在消防救灾、地下停车寻车、商场购物等领域的应用越来越多。近年来,机器学习技术在诸多领域得到了广泛的应用并取得了很好的效果,故而越来越多的研究者开始采用机器学习的方法进行室内定位的研究,这推动了机器学习的室内定位方面的发展。本文研究了基于机器学习的室内定位技术,针对现有研究存在的问题,提出了三个有效的室内跟踪定位算法。  首先,为了提高定位的准确
学位