基于队列研究和生物信息学数据挖掘初步探讨HBV宫内感染影响因素

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhenglognhai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:  1.通过前期队列研究了解武汉市HBsAg阳性孕妇乙型肝炎病毒(hepatitis B virus,HBV)宫内感染的流行现状,明确HBV宫内感染的主要影响因素。  2.构建新生儿HBV宫内感染的风险预测模型,并评价不同模型在HBV宫内感染诊断中的泛化能力,以期从宏观流行病学方面探讨HBV宫内感染危险因素。  3.使用公共数据库对与HBV宫内感染相关的基因进行二次挖掘,以期从生物信息学方面探讨与HBV宫内感染相关的基因。  方法:  1.第一部分以2012年5月至2016年12月期间进入乙肝母婴传播队列的HBsAg阳性孕妇及其新生儿为研究对象,按照出生时检测新生儿股静脉HBsAg或HBV DNA为阳性作为HBV宫内感染诊断标准,分析HBsAg阳性产妇的年龄、孕期疾病、HBV血清学暴露因素与HBV宫内感染之间的关系。  2.第二部分以新生儿是否发生HBV宫内感染为结局,采用非条件Logistic回归模型、决策树模型和BP神经网络模型构建新生儿HBV宫内感染的风险预测模型,并通过ROC曲线下面积比较三种模型,通过选取不同预测样本量来评价三种模型的泛化能力。  3.结合前期研究筛选出的HBV宫内感染易感基因,使用GEO数据库中HBV表达谱芯片GSE51489和GSE83148中按照1.2倍数改变(fold change,FC)(logFC>1.2)和P<0.05的标准筛选候选基因。对GSE51489和GSE83418两条表达谱芯片初次筛选的12个候选基因进行GO(Gene Ontology)生物富集分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路分析,同时纳入表达谱芯片GSE65389进行验证。  结果:  1.在1529名HBsAg阳性孕妇分娩的1544名新生儿中,HBV宫内感染的发生率为7.06%(109/1544)。HBeAg阳性孕妇分娩的新生儿感染HBV的风险较HBeAg阴性孕妇分娩的新生儿高(RR=3.98,95%CI:2.66-5.94);HBV DNA阳性孕妇分娩的新生儿发生HBV宫内感染风险是HBVDNA阴性孕妇的2.961倍(RR=2.96,95%CI:2.00-4.39);新生儿HBV宫内感染率随着孕妇孕晚期HBV DNA载量的升高而升高(χ2CMH=50.380,P<0.001)。  2.①多因素非条件Logistic回归模型显示:母亲孕期HBeAg阳性(OR=3.14,95%CI:1.96-5.01)、孕晚期HBV DNA载量高(OR=1.88,95%CI:1.19-2.98)均是发生HBV宫内感染的危险因素;此外,剖宫产与HBV宫内感染发生风险的降低显著相关(OR=0.41,95%CI:0.27-0.61)。Logistic回归模型ROC曲线下面积为0.731(95%CI:0.66-0.80)。  ②决策树模型分析结果显示:孕期HBeAg、孕晚期HBV DNA和分娩方式进入模型。首先进入决策树模型的因素是孕期HBeAg(χ2=51.178,P<0.001),并形成2个子集:阴性和阳性。其中,第一个阳性子集中,分娩方式进入分类树(χ2=20.626,P<0.001),并形成2个亚子集:剖宫产和顺产。在剖宫产亚子集中,孕晚期HBVDNA进入分类树(χ2=7.621,P<0.01),模型的ROC曲线下面积为0.667(95%CI:0.59-0.74)。  ③BP神经网络模型结果显示:有1个隐藏层,隐藏层中有3个单位,预测变量对HBV宫内感染发生风险影响的重要性排名前五位的依次为:孕期HBeAg、孕晚期HBV DNA、孕次、月经规律和分娩年龄,模型的ROC曲线下面积为0.668(95%CI:0.58-0.72)。  ④对三个模型ROC曲线下面积进行两两比较,差异无统计学意义(P>0.05)。分别使用30%、20%和10%的预测样本量分布评估三个模型的泛化能力,发现每个模型在不同预测样本量下的AUC比较无统计学意义(P>0.05),说明预测模型较为稳定,可以用于HBV宫内感染的预测。  3.GSE51489和GSE83148共同筛选出12个差异表达的基因:RGS1、PDE4B、MAFF、PMAIP1、JUND、PHLDA1、FOS、LAIR2、RGCC、CXCL8、SIK1、CCL20。通过GO分析和KEGG通路分析发现这12个候选基因主要富集在与免疫功能相关的疾病与通路上。PPI网络分析发现候选基因PPI之间关系非常紧密,并且FOS、JUN、ATF3位于网络的中心。在GSE65389中对PPI网络蛋白及前期分子流行病学研究中筛选出来的基因进行验证,发现TNFAIP3、CDKN1A、CD44、CXCL8、CCL20、CXCL13、PDCD1、LTA、MARS、TLR3、TLR4、SLC10A1均出现在验证的表达谱芯片中,且TNFAIP3、PDCD1、LTA和TLR3基因在GSE65389中HBV感染组与正常对照组表达差异有统计学意义(P<0.05)。  结论:  1.武汉市HBsAg阳性孕妇HBV宫内感染的发生率为7.06%。孕期HBeAg阳性、孕晚期HBV DNA阳性是HBV宫内感染发生的危险因素,剖宫产是HBV宫内感染的保护因素。  2.三个预测模型均提示母亲孕期HBeAg、孕晚期HBV DNA和分娩方式在乙肝宫内感染风险预测中起着十分重要的作用。本次研究的三个预测模型均可以用于HBV宫内感染的预测。  3.通过对HBV感染芯片数据的挖掘及生物信息学分析,筛选出差异表达基因,发现这些基因主要富集在与免疫功能相关的疾病与通路上。结合前期队列研究出的与HBV宫内感染相关的基因,在目标表达谱芯片中验证出TNFAIP3、PDCD1、LTA和TLR3在实验组和对照组中表达差异,为研究HBV感染乃至HBV宫内感染的提供新的基因和研究方向。
其他文献
为了对工业机器人进行性能测试与评估,采用连杆机构原理研制了一种机械随动式测试系统。由于采用了细分处理技术,从而提高了该系统的测试分辨率与测试精度。实验表明该系统能真
据报导白菜型油菜亩产菜籽100斤,需纯N5.8斤,甘蓝型油菜亩产菜籽100~150斤,需纯N13.5~16.5斤。由此可见白菜型油菜比甘蓝型油菜省肥。闽南地区冬种油菜因气温较高,春性较强,生
【摘要】:随着素质教育的深入,初中数学教材也从最大程度上体现了素质教育的要求。新课改要求课堂教学更多注重学生自主学习能力的培养和提高,而自主学习习惯的培养,则是自主学习能力提高的关键,因此,当前初中数学教学要更加关注学生自主学习能力的培养。  【关键词】:初中数学 课堂教学 学习方式 自主学习 能力 培养  “授人以鱼,不如授之以渔”。培养学生的自主学习能力是课程改革的核心目标,是素质教育的要求。
The structure of(E)-N-[(E)-3-[(1R,2R)-2-(3,4-dibromo-phenyl)-1-fluro-cyclopropyl]-allylidene]-2-θ-tolyl-acetamide(C_(21)H_(18)ONFBr_2,M_r=479.18)has been deter
【摘要】学中文要培养语感,学英语也要培养语感,那么学数学要培养什么呢?那就是数感。想要学生学好数学,就要使学生建立数感。根据新的《数学课程标准》对数学教学提出了培养学生数感的要求。每个小学数学教师来说,如何理解数感,如何在教学过程中帮助学生建立数感,是值得研究和思考的问题。本文结合个人的教学经验与实际操作,对如何培养数感,作浅显的探讨。  【关键词】数学素养;数感建立;数感培养  在人们的学习和生
大学英语学习的培养目标是培养学生英语综合应用的能力,特别是听读能力,多维模式的形成性评估有助于英语听力教学的改进与提高。根据新的《大学英语课程教学要求》(课程要求2004
在小学数学课堂教学中进行探究性学习,是时代发展的要求,也是基础教育改革的趋势。与传统的教学相比,小学数学探究性学习具有开放性、自主性、实践性、过程性。借助于探究和发现的学习过程,一方面可以使学生了解数学知识的来龙去脉,学习有意义的数学;另一方面可以激发学生主动探究数学问题的欲望,增强学生学习数学的内驱力,更重要的是,可以使学生养成主动思考的习惯和形成主动学习的心态。在这样的过程中,数学教学对于学生
丽欧高粱作为青饲的一个品种很有发展前途。工农联盟农场经六年试验.奶牛喜吃,增加产奶量,提高了经济效益。1981年发展到4118亩,平均亩产5057斤。喂青饲甜高粱的每头奶牛平
摘要:在初中数学的诸多解题方法中,数形结合法是一种十分直观、高效的解题方法,在数学课堂教学中被广泛应用。人教版初中数学教材中很多知识都彰显出了数形的有机结合。本文将结合具体的例题从用代数解答图形题目、用图形解答代数题目两个方面,就数形结合法在人教版初中数学教学中的具体应用,进行详细的探究。  关键词:数形结合法 初中数学 课堂教学 应用策略  将数形结合法引入初中数学课堂教学中,便于学生理顺数学知
目的:了解新型农村合作医疗政策在我省部分试点县的实施对农村居民医疗卫生服务现状的影响,探索改善卫生服务公平性的策略。 方法:利用典型抽样法选取一新型农村合作医疗试点