基于多范数约束的拷贝数变异检测模型

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:cdp850911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
拷贝数变异CNV(Copy Number Variation)是由于基因重排而导致的一种大小大于1kb的基因变异。它是人类基因组结构变异的重要组成部分,在人类疾病中扮演了重要的角色。基于此,本文分别以普通下一代测序和单细胞测序数据中的CNVs为研究对象,建立多范数约束下的优化模型,并对其进行验证和评估,主要内容如下:首先,本文简要地介绍了下一代测序和单细胞测序的工作原理,并对其在现代生物学和医学科学中的应用做了简要的回顾。其次,本文详细地介绍了上述测序的分析流程:前者的分析流程包括比对、校正、统计以及检测;后者的流程则较为复杂,为此本文着重介绍了可变窗口模型和在线分析工具Ginkgo的流程。之后,本文提出了两个模型:1)基于下一代测序的ADM-CNV,它是一种多范数的CNVs检测模型,其假定处理后的读深度信号具有稀疏性(大部分正常值为0)和平滑性(相邻两个位点的值近似相等),进而将CNVs的检测转化为一个求解多范数的优化问题,并采用经典坐标轮换算法ADMM(Alternating Direction Minimization Method)来快速高效地求解;2)而基于单细胞测序的Poisson-CNV,则根据单细胞测序数据中的噪声分布,建立CNVs信号重建模型,之后按照1)中的思路进行建模和求解。最后,本文通过模拟和真实实验来评估新模型的性能,并将实验结果与几种主流方法进行对比。结果表明新的模型在模拟和真实数据集上均表现出较好的性能,证明了模型的准确性和可行性。综上所述,本文的主要贡献如下:1)论文基于下一代测序提出了新的CNVs检测模型ADM-CNV,该模型特别考虑到拷贝数信号的稀疏性和平滑性,改进了该类信号恢复模型的不足,有效地丰富和完善了CNVs的检测方法体系;2)论文基于单细胞测序提出了新模型Poisson-CNV,该模型可较好地拟合测序数据中的技术性噪声,为单细胞测序数据中的CNVs检测提供了新的解决思路;3)Poisson-CNV模型还可用于肿瘤单细胞测序,进而为我国风起云涌的单细胞测序和临床肿瘤研究提供新颖的基础理论模型和实用算法工具。
其他文献
经济新常态意味着资源需求、环境压力将持续并不断积累强化,必须创新资源管理与资源开发利用模式以应对之.其中关键措施是地质科技人才的培养与管理.通过以国土资源部重点实验室地质科技人才培养为研究对象,总结出地质科技人才培养周期长、强调野外实践培养等地质科技人才成长规律.艰苦行业特点与宏观环境双重压力导致优秀人才排斥、人才流失严重等问题普遍.针对这些问题,从国家层面、社会层面、组织层面完善引入、育人、用人
促进我国矿业城市可持续协调发展,对资源节约型、环境友好型社会建设具有重要的意义。本文在总结已有矿业持续发展理论研究的基础上,以经济、社会、资源、环境为核心,构建了反映
土岭高岭土矿在以往开采过程中,因未严格按设计排土,由此而诱发产生的排土场边坡滑移、泥石流以及地表生态环境破坏等矿山地质环境问题日益突出,严重危害坡下矿区公路以及周
目的探究肠内营养联合茵陈蒿汤对老年性阻塞性黄疸内镜下逆行胰胆管造影(ERCP)术后的疗效。方法回顾性选取2016年1月至2017年12月上海市普陀区人民医院普外科和上海交通大学
实物地质资料管理政策,是实物地质资料管理研究的重要内容之一。随着我国地质工作的快速发展,实物地质资料管理工作已经成为地质工作的重要基础性工作之一。加强实物地质资料
矿业经济区土地复垦已成为我国研究的重点,但矿业经济区耕地抛荒问题很容易被忽视。本文总结了矿业经济区耕地利用的特点,在样本区访谈调查的基础上,从农民收益结构变动视角
现阶段,随着我国社会经济的迅速发展,自然环境也受到了严重的破坏。环境监察数据表明,为我国土地沙漠化的现象已经非常严重,如何结合当前沙漠化发展的原因,采取有效的措施阻
在本期《天风》发稿之际,一条题为“乌鲁木齐佛寺纵火者为基督徒”的网络新闻吸引了我的眼球.据新疆网报道,乌鲁木齐市中级人民法院近日向媒体发布了去年9月新疆最大汉传佛教
当前,我国国民经济处于调整时期,教育也正在进行调整。在调整时期,电化教育该如何进一步发展,这是摆在我们广大电教工作者面前的大课题。在过去的四年里,电化教育取得了可喜
本文探讨了以小径级人工林杉木为原料制造单板层积材(LVL)的可行性,研究采用二次正交旋转组合设计,系统分析了热压温度、热压时间及热压压力三因子与LVL物理力学性能的关系,并得到了实验