【摘 要】
:
教材插图分类作为在线交互学习的先验技术手段,对于教材理解及插图问答至关重要。插图通常是被有意设计用来表达信息,很难用几个文字或者用一幅自然图像来描述。它们通常会抑制不相关的信息,比如杂乱的背景,复杂的纹理以及阴影的细微差别。这就使得对教材插图的分类与自然图像的分类有本质上的不同。鉴于插图应用广泛且涵盖信息较多,本文对教材插图的分类算法进行初步探索及研究优化。对于插图数据集中存在的特征相似性问题,使
论文部分内容阅读
教材插图分类作为在线交互学习的先验技术手段,对于教材理解及插图问答至关重要。插图通常是被有意设计用来表达信息,很难用几个文字或者用一幅自然图像来描述。它们通常会抑制不相关的信息,比如杂乱的背景,复杂的纹理以及阴影的细微差别。这就使得对教材插图的分类与自然图像的分类有本质上的不同。鉴于插图应用广泛且涵盖信息较多,本文对教材插图的分类算法进行初步探索及研究优化。对于插图数据集中存在的特征相似性问题,使用普通的分类网络对其中部分易混淆的图片难以区分。本文针对插图数据集中类间距较小、背景复杂等问题,结合细粒度分类的相关工作,提出了多种基于注意力结构的分类模型,主要工作以及相关贡献如下:(1)针对普通图像分类网络中多尺度融合的思想,以ResNet作为骨干网络将多层不同尺度的特征图进行再变换、融合,并对WSDAN细粒度分类网络的注意力模块改进,从而实现不同维度上的注意力特征提取,以此获得更加精确有效的注意力特征,从而提高分类精度。(2)从网络结构和特征维度的角度出发,在多尺度特征融合注意力提取结构的基础上,再结合Domain SENet中特征维度注意力提取的思路,从特征维度的层面上对提取的注意力特征进行增强优化。为了探究最优分组数,并将注意力图划分为不同的分组进行对比实验,最终得到对目标多部件敏感的注意力特征图。(3)从卷积核的角度出发,并以多尺度特征融合注意力提取结构为基础。通过在注意力提取模块中,分别使用空洞卷积、可变形卷积两个不规则卷积块,使注意力提取结构对分类目标的轮廓更加敏感。从卷积核形状的角度应用注意力机制,最终得到一个对目标关键部位敏感程度更高的注意力特征图。
其他文献
近年来电影行业迅速发展,影片的制作数量和制作成本都有逐年上升的趋势,竞争日趋激烈,而且电影制作本身流程复杂、涉及环节多、时间长,使得电影行业风险越来越高。电影票房的
在以往的研究中发现微重力对动物细胞的生理状态具有显著的影响,但以往的研究偏重于微重力对于各项生理指标的影响,对于具体的分子机制研究较少。众所周知,细胞内的信号通路
马克思主义是中国特色社会主义社会最鲜明的旗帜,是我国社会主义建设事业的指导思想。马克思主义在社会主义新农村建设中的地位至关重要,积极推进当代农村马克思主义大众化对于马克思主义理论的发展、加强和巩固党的执政地位以及社会主义新农村的建设具有十分重要的意义。在上个世纪六、七十年代全民学哲学运动中,当时的浙江省江山县勤俭大队异军突起,成为全国农村学哲学的典范,被誉为“中国农民哲学村”。本文以“中国农民哲学
现代汉语中存在各种各样的结构,动补结构就是其中的一种,其是由动词和补语两部分组成的句法结构,一般认为补语部分对动词部分起到补充说明的作用。不少学者认为它在印欧语系
目的:通过模糊衍生技术、微量富集方法及高效液相色谱法分离、鉴定与纯化异烟肼(INH)潜在新活性成分。方法:将具有抗结核作用的异烟肼(INH)配制成10%的INH甲醇溶液,以线样上
微重力对骨髓间充质干细胞增殖和成骨分化抑制可能是空间飞行中骨形成减少的原因之一。这些效应的分子机制可能涉及到细胞粘附性的细胞骨架改变。本研究以C57BL/6小鼠骨髓间
在应对全球气候变化过程中,控制二氧化碳的排放成为减缓气候变化、有效配置环境中的各项大气资源,平衡发达国家与发展中国家利益的有效手段。据统计,在全球排放温室气体的各类交通运输行业中,国际民航业的碳排放量已经占到了全球人为碳排放总量的2%;根据国际民航组织的预测,到2050年,全球民航碳排放量预计还将增长三至七倍。因而,对民用航空业排放的二氧化碳进行有效控制是减缓全球气候变化的必经之路;对相应民航碳减
《经典释文》是爲包括《周易》、《论語》在内的十四部經典著作注音釋義的音義書,《老子音義》作為《經典釋文》中的第二十五篇,對於《老子》的校勘以及傳播都具有重要的意義
全球化促进了世界人物传记文化的交流,对于异国读者来说,他们既希望了解异国人物事迹,也希望增进对异域本土文化的认识。然而众多文学翻译作品中,人物传记翻译作品少之又少,
合成孔径雷达(SAR)因其产生高分辨率图像而备受关注。在实际工作中,SAR受多种复杂因素的影响,比如相干斑噪声、传输过程中噪声干扰、人为损坏等,会使SAR图像出现不同程度的破损,导致接收到的SAR图像分辨率和清晰度不高,影响使用效果。为了增强SAR有损图像的分辨率,提高其清晰度,使之恢复到更接近原始图像,需要对SAR有损图像进行有效恢复。本文提出了联合低秩稀疏的SAR有损图像恢复,主要内容如下:(