联合多尺度和注意力机制的遥感影像检测

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:xphan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遥感影像中目标的检测问题一直是遥感图像处理领域的热点和难点。传统的检测算法,在解决场景复杂,尺度差异大的目标时性能不高,而使用深度学习很难兼顾遥感目标的准确性和实时性。针对这一问题,设计了一种利用多尺度融合特征检测目标的轻量级网络,并提出一种能够从三个维度上生成像素自适应特征权重的注意力机制帮助提取显著特征,同时采用了最新的优化算法改善模型的性能,在减少计算量的同时保证了检测精度。实验结果表明,该模型MAP@0.5可达0.945,F1可达0.841,检测速度满足实时性要求。
其他文献
流形学习是一类特殊的非线性求解问题,即从高维采样数据中恢复低维流形结构,以达到维数约简的目的,是模式识别与数据可视化中的重要方法。流形学习存在许多基于局部线性假设的数值解法,即显示地定义局部线性映射模型再进行全局优化,这些方法对于流形的形状、采样的方式都比较敏感。另一种非线性求解工具,神经网络,因为不依赖于具体数学模型,理论上具有较好的鲁棒性,但是流形学习的特殊非线性,使得传统神经网络很难达到满意的效果。针对上述问题,改进了一种同质双通道神经网络——孪生网络,并应用于流形学习。针对孪生网络的两条通道,设计
阻塞性睡眠呼吸暂停(Obstructive Sleep Apnea,OSA)是成年人较为常见的呼吸类疾病之一,该疾病的特点是睡眠过程中频繁出现上气道完全或部分塌陷,严重影响人们的睡眠质量以及身体健康。阻塞性睡眠呼吸暂停综合征的诊断主要依靠多导睡眠监测,但这种方法无法满足目前大量的诊断需求。随着人工智能的出现及发展,假设深度学习可以有效地协助医生进行诊断该综合征。主要从阻塞性睡眠呼吸暂停的临床诊断方式出发,介绍了颅面侧位片作为诊断数据集的优势,以及人工智能诊断OSA的现状,提出了人工智能辅助医师诊断OSA的
目前关于商品评论的深度网络模型难以有效利用评论中的用户信息和产品信息。提出一种基于注意力交互机制的层次网络(HNAIM)模型。该模型利用层次网络对不同粒度语义信息进行提取,并通过注意力交互机制在层次网络中通过捕捉用户、产品中的重要特征来帮助提取文本特征。最终将用户视角下的损失值和产品视角下的损失值作为辅助分类信息,并利用层次网络输出的针对用户或产品的关键文本特征进行训练和分类。三个公开数据集上对比结果表明,该模型较相关模型而言效果均有提升。
目标检测确定检测图像中目标对象所在区域及其类别,语义分割对检测图像实现像素级分类,实例分割可以定义为同时解决目标检测与语义分割问题,在分类的同时确定每个目标实例语义。实例分割网络在无人机驾驶、机器人抓取、工业筛检等领域具有重要应用意义,针对目前基于深度学习实例分割综述性文章的空白,对实例分割进展进行概述,按照单阶段实例分割与双阶段实例分割的分类对不同网络模型进行论述,重点介绍近两年网络框架的发展,总结各网络特点的同时提出未来发展方向。
以求异性提问激活思维,使学生学会多重角度处理问题的本领;以延伸性提问拓展思维,使学生学会应对危急的本领;以推理联想提问激活思维,使学生学会揭示课文内涵的本领.
Every one of us knows the sensation of going up, on retreat, toa high place and feeling ourselves so lifted up that we canhardly imagine the circumstances of o
针对现有的多标记迁移学习忽略条件分布而导致泛化能力不足的问题,设计了一种基于联合分布的多标记迁移学习(Multi-label Transfer Learning via Joint Distribution Alignment,J-MLTL)。分解原始特征生成特征子空间,在子空间中计算条件分布的权重系数,最小化跨领域数据的边际分布和条件分布差异;此外,为了防止标记内部结构信息损失,利用超图对具有多个相同标签的数据进行连接,保持领域内几何流行结构不受领域外知识结构的影响,进一步最小化领域间的分布差异。实验结
语音合成技术在人机交互中扮演着重要角色,深度学习的发展带动语音合成技术高速发展。基于深度学习的语音合成技术在合成语音的质量和速度上都超过了传统语音合成技术。从基于深度学习的声码器和声学模型出发对语音合成技术进行综述,探讨各类声码器和声学模型的工作原理及其优缺点,在此基础上对语音合成系统进行综述,系统综述经典的基于深度学习的语音合成系统,对基于深度学习的语音合成技术进行展望。
研究LeNet-5在扫描文档中手写体日期字符识别的应用,由于文档扫描的过程中会引入各种噪声,特别是光照和颜色干扰,直接使用LeNet-5算法不能取得较好效果。先在整份文档中对特定待识别字符的进行定位和划分,并对划分出的字符图像进行去噪、灰度化和二值化处理等预处理,接着将字符图像分割成一个个单个字符,然后在LeNet-5网络基础上结合模型匹配法实现对手写体日期字符的识别。分析在不同参数组合下的识别效果,调整算法模型参数有效地提升了模型对于实际对象的性能,实现出一种能够对手写体日期字符集实现较好识别效果的算法
随着COVID-19的大流行,接触人跟踪系统成为了应对疾病蔓延的重要工具。接触人跟踪系统包括跟踪和监察等功能,主要采用手机等智能设备,通过技术手段实现对接触过感染者个体的识别,并通知其是否需要隔离检疫。基于此方法,能够从人群中剔除最初出现症状的个体,有效减少病毒的传播。对现有接触人跟踪系统进行系统化的综述分析。研究了人工接触跟踪与自动接触人跟踪,阐明人工接触跟踪的不足以及自动接触人跟踪对疫情的好处。系统地阐述中心化接触人跟踪系统与去中心化接触人跟踪系统的原理,比较中心化系统与去中心化系统之间的差异。对接触