论文部分内容阅读
近年来基因测序技术和影像学诊断技术的不断进步为影像遗传学奠定了技术基础,影像遗传学作为将两种技术结合运用的交叉学科,其现实意义在于通过研究基因与脑部影像特征之间的关联来探索疾病的内在机理,并在生物信息挖掘方面具有重要作用。机器学习方法是影像遗传学研究的主要方法之一,通过稀疏学习的方法我们可以从已知的生物信息数据中构建关联学习模型,然后通过求解模型目标函数来筛选出与疾病相关的基因位点和影像特征。而通过研究得到的风险因素是辅助疾病诊断和靶向治疗的有效线索。本文主要研究工作和创新点如下:首先,为了有效利用脑区之间的功能连接信息和充分利用多模态脑影像数据的互补信息,本文提出了一种基于结构和功能两个模态融合的影像特征回归基因型方法。具体来说,我们采用基于稀疏学习的弹性网络算法分别对经过预处理之后的结构核磁共振图像和功能核磁共振图像进行特征选择,将重要的体素特征和功能性网络连接特征保留下来,然后进一步采用多核支持向量回归机来对特定位点的基因型进行回归。在公开数据集上的实验效果证实了本文提出框架的有效性,并且在每一个模态的特征选择过程中发现了与疾病有较高关联程度的生物标记。其次,最近研究表明相较于传统基于成对节点的网络特征构建方式,基于超图的网络构建方式能够反应多个脑区之间的功能连接信息,从而传递高阶连接信息,因此本文还提出了一种基于超网络的稀疏多任务关联分析方法。具体而言,我们利用稀疏表示的方法对功能性核磁共振图像进行处理并建立超网络,然后从超网络中提取三种聚类系数作为表征脑部功能特性的特征,接着采用基于稀疏学习的多任务典型相关分析来同时获取基因型与影像特征之间的关联。实验结果表明,本文提出的基于超网络和多任务的算法可以提高关联分析效果,并同时获得一些有助于研究疾病病理的关键生物因素。