基于AMC-Net和SSIP的人体蛋白图谱识别研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:o9876521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于多标签图像的复杂布局、对象之间的遮挡、单标签图像算法直接迁移表现不佳等因素,使得多标签图像识别模型很难达到实际应用的性能要求。此外,医学图像因不同类别之间特征差异较小,特征识别难度高,数据不均衡等因素,处理起来难度也更高。深度卷积神经网络因其强大的拟合能力和良好的泛化性能,已广泛应用于单标签图像识别任务当中。但由于多标签图像任务的识别难度远高于单标签图像任务,把单标签识别任务中优异的模型和方法直接迁移到多标签识别任务中也很难满足性能需求。本文所研究的人体蛋白图谱图像数据集是多标签数据集,即其中每张图片都可能包含多个标签,这就使得一般的单标签方法失效,需采用多标签方法来解决问题。目前已有的一些关于人体蛋白图谱图片的识别研究,还不能与专家识别水平相提并论。随着医疗水平提高,数据累计越来越多,人工识别的方法日渐乏力,一个高性能的人体蛋白自动识别系统亟待设计。我们通过对目标检测、图像分割等相关理论和该数据集的特殊性进行分析,在选择性搜索算法的基础上提出了组合选择性搜索算法。同时,基于多标签问题转换理论和多尺度模型理论,分别提出了深度模型SSIP和卷积网络AMC-Net。另外提出了组合损失函数等优化方法。本文研究结果概况如下:(1)AMC-Net模型:针对蛋白质特征尺度变化大的问题,论文设计了一个多输入的非对称多尺度卷积神经网络AMC-Net用于处理不同尺度的蛋白质特征。该网络通过将输入图像缩放到三种不同尺度后,将其同时输入到网络模型中,模型的三个分支拥有不同的卷积核大小和池化核大小。其中,大尺度的图像对应大尺度的卷积核分支。实验证明这种多尺度和多输入的模型可以达到很好的分类效果,取得了0.821的F1分数。(2)SSIP模型:针对数据集的多标签属性,论文设计了一个新颖的端到端多标签分类框架SSIP,该框架集成了改进的目标检测算法、自主设计的卷积神经网络、最大池化层以及阈值法。其中,目标检测算法基于目前先进的选择性搜索算法,并针对人体蛋白图谱图像信息分通道存储的特征,提出了组合选择性搜索算法。此外,论文还进行了大量的实验来评估SSIP框架,并证明了其具有良好的鲁棒性,在实验中其F1分数最高达到0.83。(3)优化方面:在监督信号优化上,本文引入了组合损失函数。组合损失函数由二元交叉熵损失函数和F1分数损失函数调和而成,在缓解数据集类别严重失衡导致的模型过拟合问题的同时,可以指导模型提升F1分数(相较单独使用Focal loss提升了约0.015),且没有增加额外的计算量。在SSIP框架目标检测的优化上,本文提出多尺度目标检测方法,有效降低了漏检率,提升了F1分数约0.016。本文以人体蛋白图谱数据集为实验对象,通过大量的对比实验,证明了所提出的AMC-Net、SSIP模型具有很好的鲁棒性,同时也通过实验证明了损失函数优化方法、多尺度优化方法等可以显著提升人体蛋白图谱识别的性能,为解决基本的生物学问题提供可行的研究工具。
其他文献
鸭瘟病毒(Duck plague virus,DPV)属于α疱疹病毒亚科成员,在α疱疹病毒亚科中,UL6蛋白一般在细胞核内发挥功能,但是目前对于DPV UL6蛋白如何进入细胞核这一问题尚未阐明。本文通过构建重组病毒以及间接免疫荧光等实验方法发现UL6蛋白定位于细胞核内,并进一步阐明DPV UL6蛋白的入核机制,以及对构建的病毒突变株进行疫苗潜力评价。围绕上述目的,进行的主要研究内容以及获得的结果如
目的:在耳内镜下使用自体听骨对慢性化脓性中耳炎患者进行鼓室成形并听骨链重建术,观察其短期疗效以及预后影响因素。方法:回顾性分析解放军联勤保障部队第九二一医院耳鼻喉科于2015年5月至2021年1月期间治疗的43例(耳)慢性化脓性中耳炎患者的临床资料,所有患者均使用自体听骨在耳内镜下行鼓室成形并听骨链重建术,探讨患者术后的疗效及影响其术后听力恢复效果的因素,所有的患者手术前后均行听力学评估,并统计在
类胡萝卜素是一类重要的天然色素的总称,在自然界中广泛存在,具有特殊生理功能和药理功能,对人类身体健康有着非常重要的作用。但人体自身无法合成类胡萝卜素,需从外界摄取。猕猴桃作为一种高营养风味佳的水果,一直以来都受到消费者的喜爱,除了高含量的维生素C,也含有丰富的类胡萝卜素。本试验以猕猴桃果实为材料,比较了13份材料类胡萝卜素含量的差异;研究了黄肉猕猴桃果实生长发育期类胡萝卜素的积累水平及相关基因的表
随着退耕还林、天然林保护和龙泉山脉生态植被恢复工程等林业项目的实施,金堂县森林昆虫种类发生了较大变化。本实验通过线路调查与标准地调查等方式采集标本建立和完善了金堂县森林昆虫种类数据库;以占科数及物种数比例最大的鞘翅目有害昆虫为代表进行生物多样性研究,了解到森林昆虫的发生规律;并对部分分布广、发生面积大的林业害虫进行风险性分析,为以后开展预防和治理提供了基础数据。主要结论如下:(1)森林昆虫调查表明
为探究蜡样芽孢杆菌PAS38影响肉鸡免疫的分子机制,将60羽7日龄肉鸡分为2组,对照组饲喂基础日粮,试验组饲喂试含蜡样芽孢杆菌PAS38 1×106 CFU/g的基础日粮;于42日龄时从每个组随机取6只肉鸡,解剖采取脾脏、胸腺和法氏囊,采用SSH技术构建差异基因文库,并对文库进行GO注释,筛选得到免疫相关差异基因;最后利用siRNA技术干扰部分差异基因在肉鸡淋巴细胞中的表达,检测IL-1B、IL-
随着传统能源危机的加剧和环境问题的日益突出,人类日益重视对核能的开发与利用。我国提出巨型激光装置的研制计划,其承担着开启惯性约束核聚变的重大任务。数千特种实验模块的转运与装校是巨型激光装置研制中的关键一环,其需要数十台甚至上百台特种实验模块装校系统。在重负载条件工况下,特种实验模块装校系统耗能特别多,会减少电池使用时间,降低工作效率,因此在进行工作过程中,减少能量消耗是需要解决的一个重要问题。鉴于
鸭瘟病毒(Duck plague virus,DPV)能够引起鸭、鹅、大雁等雁形目禽类的急性、热性、败血性传染病。本论文构建了DPV LORF4基因缺失病毒,观察了该缺失病毒的毒力变化并对其免疫效果进行了评价。研究内容和结果如下:1.DPV-CHvΔLORF4缺失病毒构建利用本实验室构建的DPV CHv株细菌人工染色体(Bacterial Artificial Chromosome,BAC)平台以
伪狂犬病毒属疱疹病毒科,可感染家畜和野生动物,猪是主要的宿主和传染源,仔猪一旦被感染,死亡率可达100%。目前尚无特效治疗药,多为疫苗防控。但由于病毒变异导致毒力增强和动物个体天然免疫力低下,常造成接种失败。已有研究发现,在接种疫苗时,配合适当的免疫增强剂,可提高接种成功率。实验室前期研究表明,白藜芦醇(Resveratrol,Res)具有免疫调节作用。本研究选择小鼠为试验动物,拟通过检测受免小鼠
林木种质资源是林木遗传多样性载体和林木遗传改良及新品种选育的基础材料,对林业经济和生态文明建设有重要的战略意义。查清资源现状和分布规律,总结地理空间特征是林木种质资源合理保护、高效利用、永续开发的前提。德昌县拥有丰富的林木种质资源,包含了极高水平的木本植物多样性和遗传多样性,是维持四川西南地区生态稳定的关键资源循环地。查清德昌县林木种质资源分布现状,分析其地理空间特征,可为制定资源长期保护和利用规
大熊猫种群中犬瘟热病毒(CDV)、犬细小病毒(CPV)感染不时给大熊猫种群安全带来不良影响,且还无安全有效的疫苗可供应用。病毒样颗粒(VLPs)与天然病毒颗粒相似但不含核酸,有较好的安全性与免疫效果,研制CDV/CPV VLPs对于防控大熊猫CDV/CPV感染具有重要的意义。本研究通过原核表达设计制备展示犬瘟热病毒抗原表位的大熊猫源犬细小病毒病毒样颗粒,通过动物免疫实验检测所制备的CDV/CPV