论文部分内容阅读
在复杂疾病的研究中,生物标志物可以作为客观测定和检验正常生理、病理过程和临床诊断中的具有某些特定表征的生化指标。凭借对相应标志物的检测,可以深入理解疾病的亚临床型和生物学过程,是针对疾病实施精准化医疗和个体化医疗的基础,探索和挖掘有意义的生物标志物已经成为生物医疗领域中一个重要的热点。但是,由于现有算法的局限性,对于同一种复杂疾病的研究,不同研究机构得到的生物标志物通常并不一致,这引起了人们对这些标志物的临床应用及高通量技术可靠性的质疑,急需引入新的可靠的标志物识别算法。
本文基于系统生物学的观点,结合多种“组学”数据,以乒乓算法模型为基础从三个方面对复杂疾病标志物进行了深入探讨,主要研究工作包括:
(1)本文提出了一种新的基于乒乓算法的复杂疾病药物靶点识别方法。本文通过研究各类传统药物靶点识别方法运算模式,整合考虑不同数据集间的相互作用,基于乒乓算法模型建立“药物-基因”、“药物-基因集”关系模块,通过进一步的生物学分析筛选出药物靶点。将此方法与其它传统药物靶点识别算法同时应用于NCI-60细胞系药物反应和基因表达谱数据中,本文方法在识别能力和计算效率两大方面均占优势,验证了本文识别方法是更为有效的过程。
(2)本文以TNM分期系统为研究目标,提出了一种新的复杂疾病分期判别方法。本方法利用乒乓算法模型具有从全局角度分析,将不同维度数据模块化的特点,以临床样本数据为桥构建“mRNA-临床样本-lncRNA”数据集,通过质量控制、富集分析等手段,筛选具有代表性的复杂疾病分期标志物。将本文的方法应用到食管癌数据的分析中,筛选出两个具有食管癌分期标识的标志物模块,通过生物学分析知,本文的方法切实有效。
(3)本文提出了一种基于乒乓算法和随机游走策略的复杂疾病标志物识别方法。该方法应用乒乓算法模型构建“mRNA-lncRNA”交互网络,并在此基础之上,通过随机游走筛选疾病标志物。将该方法应用在食管癌标志物识别并将结果与经典识别方法t检验结果进行比较,数据显示,本文方法得到的mRNA和lncRNA均可作为食管癌的标志物并识别出多个t检验无法识别的生物标识。本文方法构网时在研究mRNA和lncRNA个体特征基础之上,同时分析mRNA和mRNA、mRNA和lncRNA、lncRNA和lncRNA之间的交互作用,数据显示本方法具有较高的准确性和有效性,为识别和分析疾病标志物提供了新的思路。
本文基于系统生物学的观点,结合多种“组学”数据,以乒乓算法模型为基础从三个方面对复杂疾病标志物进行了深入探讨,主要研究工作包括:
(1)本文提出了一种新的基于乒乓算法的复杂疾病药物靶点识别方法。本文通过研究各类传统药物靶点识别方法运算模式,整合考虑不同数据集间的相互作用,基于乒乓算法模型建立“药物-基因”、“药物-基因集”关系模块,通过进一步的生物学分析筛选出药物靶点。将此方法与其它传统药物靶点识别算法同时应用于NCI-60细胞系药物反应和基因表达谱数据中,本文方法在识别能力和计算效率两大方面均占优势,验证了本文识别方法是更为有效的过程。
(2)本文以TNM分期系统为研究目标,提出了一种新的复杂疾病分期判别方法。本方法利用乒乓算法模型具有从全局角度分析,将不同维度数据模块化的特点,以临床样本数据为桥构建“mRNA-临床样本-lncRNA”数据集,通过质量控制、富集分析等手段,筛选具有代表性的复杂疾病分期标志物。将本文的方法应用到食管癌数据的分析中,筛选出两个具有食管癌分期标识的标志物模块,通过生物学分析知,本文的方法切实有效。
(3)本文提出了一种基于乒乓算法和随机游走策略的复杂疾病标志物识别方法。该方法应用乒乓算法模型构建“mRNA-lncRNA”交互网络,并在此基础之上,通过随机游走筛选疾病标志物。将该方法应用在食管癌标志物识别并将结果与经典识别方法t检验结果进行比较,数据显示,本文方法得到的mRNA和lncRNA均可作为食管癌的标志物并识别出多个t检验无法识别的生物标识。本文方法构网时在研究mRNA和lncRNA个体特征基础之上,同时分析mRNA和mRNA、mRNA和lncRNA、lncRNA和lncRNA之间的交互作用,数据显示本方法具有较高的准确性和有效性,为识别和分析疾病标志物提供了新的思路。