基于医学眼底图片的多标签分类的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:liaoquanya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医学眼底图片是一种通过专业片机对于眼底信息拍摄所生成的一种特别的自然图片,这类图片主要应用在医学眼部诊断,为眼科专家在诊断眼底疾病提供强有力的科学根据。然而,对于相机生成的每张眼底图片都需要专业医生进行详细分析,由于眼底图片数量庞大,无疑会浪费很多的时间和精力去分析眼底疾病的疾病种类。如今深度学习技术对眼底图片分类已经取得突破性进展,其准确率大幅度提高,这样的算法大部分针对于是否患有某类疾病的单标签分类的算法,对于一张眼底图片往往可能是患有多种疾病。在本文中,研究对眼底图片进行多分类算法,联合考虑消除类别不平衡和类别数量已知指导分类优化。图片多标签分类任务是一个比较复杂的问题,不同于单标签多类别分类那样只需要预测出一种类别,它需要将图片中的所有存在的类别都预测出来,这通常是类别数量不确定和其组合多样。本课题通过对眼底图片进行类别数量预测,采用数据驱动的方式从医学眼底图片的数据集中提取出每张图片所包含的病患种类的信息。在类别数量先验的情况下,利用输出类别确定简化多标签分类难度,并提高多标签分类准确率,具体而言:首先本文对于分类特征提取的网络进行改进,设计了一种VGG结构的仅仅包含10层的新的网络,然后利用元学习的模型类似MAML的学习过程,对该分类网络产生的损失值构造类似感知器网络进行加权映射,最终通过新的损失加权来消除对于训练数据集中的类别不平衡对最终分类准确率的影响。使得最终得到更加精准的类别分类预测。接下来利用以得到的类别信息,设计出一种基于类别数量先验的多标签分类网络。本文对于多标签分类网络进行特征提取采用的是残差网络Res Net50,并在最后输出层做轻微调整,使得将多标签的分类任务转化为多值的二分类任务。之后利用种类数量已知的条件设计出一个Topk的模块,其中Topk用来筛选出最有可能的类别组合,通过利用预测出的种类组合和标签之间的损失值来更新网络参数。并且对于原先的损失函数进行改进,使得它和Topk这一过程相切合。通过对比实验分析,本文的方法在准确率上优于其他的方法,并且在ODIR-5K眼底图片数据集上实现了目前最好的结果。
其他文献
试论经济发展与企业家的培育张锐发展经济学家普遍认为,发展中国家最稀缺的资源是决策人才。同其它发展中国家一样,制约我国经济发展的最大缺口可以说是缺乏企业家,如今它已成为我国实现由计划经济体制向市场经济体制转轨的重大瓶颈。诚然,实现市场经济条件下经济的快...
目的探讨对手术室糖尿病患者采取细节护理的护理效果。方法选取2018年5月—2019年5月到该院进行手术的糖尿病患者96例,将入选患者随机分为对照组和观察组,对照组48例患者行手
建设文化大省是浙江省在新时期社会主义两个文明建设的重要任务,是一项宏大的社会系统工程。在建设文化大省过程中,必须以发展文化产业为突破口,努力使文化产业成为全省国民经济
我国恢复关贸总协定缔约国地位的谈判工作,有了很大进展,1993年可望“入关”。恢复关贸总协定缔约国地位之后,我国同世界经济的相互依存更加紧密,我国面临着广阔的、多元的国际大
近两年来,邢台县委、县政府深入贯彻落实科学发展观,紧紧围绕‘富民、强县”两大主题,以主导产业、节能减排、园区发展、生态旅游和民生改善为切入点,不断创新发展模式,转变发展方
采用氧化还原法制备了α, δ, γ-MnO2载体, 采用原位还原法制备了Au负载量为0.5%-3.0%的Au/γ-MnO2催化剂, 并采用X射线衍射、扫描电镜、透射电镜和N2物理吸附等手段对其进
城市作为人类相互联系、聚集、聚居的产物,是人类文明的标志。人类文明的主要成果基本上都是城市创造和发展的。“没有城市,文明就很少有可能兴起”。由于城市对人类社会进步所
财政支农资金是各级政府为落实中央的“三农”政策,扶持农业生产和产业结构调整而设立的,但在实际工作中,还存在资金投入分散。效益低下,浪费严重,甚至挤占挪用等现象,因此,必须加强
陈懿(1933)先生是我国著名物理化学家和教育家,长期从事物理化学和多相催化的教学与研究工作.他编写的《物理化学》和《物理化学》简明本(傅献彩、陈懿主编,人民教育出版社,1
目前学术界流行着一种“新道家”说,这种观点是把战国末年或者说是自秦开始到汉初盛行的黄老学派,称之为“新道家”,并且将《吕氏春秋》等几部“杂家”著作,指为新道家的代表作,这