【摘 要】
:
近年来许多基于通用目标检测框架的文本检测方法相继被提出,这些方法往往是直接预测文本的整个边界框,受网络感受野的限制而难以有效检测长文本.为改进长文本难以有效检测的问题,提出了基于短边顶点回归网络的文本检测方法.该方法将文本区域划分为3类区域,即两条短边附近的区域及中间区域,采用分离再组合的方式检测文本,不再直接预测文本的整个边界框.首先,在一个融合多层特征的残差网络上预测分割3类文本区域,同时还将在每个短边区域的像素点处预测与之邻近的一条短边的两个顶点.然后,在后处理过程中,利用文本中间区域与短边区域相邻
【机 构】
:
同济大学 电子与信息工程学院,上海201804
论文部分内容阅读
近年来许多基于通用目标检测框架的文本检测方法相继被提出,这些方法往往是直接预测文本的整个边界框,受网络感受野的限制而难以有效检测长文本.为改进长文本难以有效检测的问题,提出了基于短边顶点回归网络的文本检测方法.该方法将文本区域划分为3类区域,即两条短边附近的区域及中间区域,采用分离再组合的方式检测文本,不再直接预测文本的整个边界框.首先,在一个融合多层特征的残差网络上预测分割3类文本区域,同时还将在每个短边区域的像素点处预测与之邻近的一条短边的两个顶点.然后,在后处理过程中,利用文本中间区域与短边区域相邻的关系将文本两类短边区域进行组合,两类短边区域预测的短边顶点将随之结合,便能产生完整精确的文本检测结果.在一个长文本检测数据集和公开的MSRA-TD 500,ICDAR 2015及ICDAR 2013自然场景文本检测数据集上进行测试比较,该方法的精度与速度超过目前绝大部分方法.实验结果表明,该方法在文本检测,尤其是长文本检测,具有一定的优越性.
其他文献
为满足高光谱异常检测研究所需的大量地物高光谱图像需求,提出利用待观测地物的高光谱特性仿真数据及背景特性数据生成高光谱图像的方法,开展了典型飞机流动与传热模型、红外辐射特性模型、高光谱图像仿真模型研究;以实验测定的飞机反射率为输入开展目标特性计算,结合实际观测的背景起伏图像,在特定遥感器光谱响应特性、遥感器相对定标误差、随机加性噪声等条件下,生成了不同像元丰度、不同信噪比的高光谱图像,并应用经典的RX算法、CEM算法检测了仿真图像的异常像元.研究结果表明:建立的模型可以根据遥感器的性能指标参数、目标丰度要求
为降低空中加油对接过程中头波作用对软管-锥套的扰动,提高空中加油对接成功率,对头波影响范围内软管-锥套运动特性进行了仿真与分析.首先,基于集中参数原理的多刚体动力学,建立了包含软管弹性及弯曲恢复力矩且长度可变的软管锥套组合体动力学模型.然后,采用拟合半兰金体头波理论模型模拟符合受油机头部外形尺寸的头波流场.最后,通过综合考虑紊流、重力以及加油机尾流等因素的数值仿真,获得了头波作用下软管锥套的运动特性,就不同对接高度、飞行速度、软管材料、对接速度、对接方式和受油机头部外形等因素对头波作用下软管锥套运动特性的
固定化生物技术是一种新兴生物工程技术,相比传统生物技术,具有生物负载率高、运行稳定、处理效率高、产泥少、易固液分离等优势,解决了传统生物技术的发展缺陷,在污水应用中具有广泛的前景.为了更好的推动固定化技术在实际工程中的应用,介绍了固定化生物技术的特点、固定方法、载体选择以及在水处理领域的应用,分析了不同固定方法的优缺点,重点分析了在印染废水、制药废水、养殖废水、生活污水等不同类型水质处理中的应用.
为研究初始参数对回转体并联入水空泡及运动特性影响,基于有限体积法,采用realizable k-ε湍流模型、VOF(volume of fluid)多相流模型和Schnerr and Sauer空化模型,并引入重叠网格技术,对不同入水速度、不同初始净距和不同横流速度的回转体并联入水过程进行数值模拟.首先,建立了回转体高速并联入水的数值计算模型,验证了计算方法的有效性.然后,基于此模型开展不同初始参数的并联入水数值计算,得到不同参数下的流场及运动特征.最后,结合计算结果分析了不同参数下并联运动体的空泡形态及
无人作战飞机(unmanned combat aerial vehicle,UCAV)在进行空战自主机动决策时,面临大规模计算,易受敌方不确定性操纵的影响.针对这一问题,提出了一种基于深度强化学习算法的无人作战飞机空战自主机动决策模型.利用该算法,无人作战飞机可以在空战中自主地进行机动决策以获得优势地位.首先,基于飞机控制系统,利用MATLAB/Simulink仿真平台搭建了六自由度无人作战飞机模型,选取适当的空战动作作为机动输出.在此基础上,设计了无人作战飞机空战自主机动的决策模型,通过敌我双方的相对运
为提高空地导弹碰撞角约束制导的精度和鲁棒性,增强其对防空系统的突防能力和对目标的打击效果,基于纯比例导引律(pure proportional navigation,PPN)拦截固定目标的解析解,提出了一种新的三维碰撞角约束制导律(three-dimensional PPN-based impact-angle-control guidance law,3D-PPNIACG).首先,基于PPN拦截固定目标解析解,分析了基于PPN的二维碰撞角约束制导律(two-dimensional PPN-based i
为研究旋翼机对降落伞工作性能的非定常影响,建立一套适用于旋翼机伞降系统非定常复合流场的数值模拟方法.首先,采用PISO(pressure implicit split operator)算法和Reliazable k-ε湍流模型,以提高瞬态计算效率和粘性计算精度,准确捕捉流场尾涡细节变化.其次,建立了高效的动态网格更新模型,结合Diffusion Smoothing和Remeshing两种网格更新方法,对不同变形尺度的网格进行分类处理.在此基础上,研究了旋翼扰动下物伞系统的非定常尾流特征和降落伞气动特性的
为提升光学图像在低照度条件下的可用性,对红外图像与可见光图像进行融合从而结合两者的优势是一种有效的技术手段.稀疏表示理论在红外与可见光图像融合领域已经得到了广泛的应用,然而基于稀疏表示理论的图像融合方法所采用的局部建模方式易于导致语义信息损失和对误匹配的低容忍度两大缺陷.卷积稀疏表示的全局建模能力对克服上述不足具有巨大的优势,本研究借鉴卷积神经网络的结构设计了一种前馈式基于多层卷积稀疏表示的红外与可见光图像融合网络,该网络包含5层:第1、2层为卷积稀疏层,通过预训练的字典滤波器获取源图像的卷积稀疏响应;第
为改善直升机舰面起降过程中起降安全性,基于单向耦合策略建立了一套适用于直升机/舰船动态界面(dynamic in-terface)研究的数值模拟方法,针对不同主动射流方案对侧风状态下直升机着舰过程中的影响进行了分析.首先,采用分离涡模拟(DES)方法获得不同射流方案下的艉流场数据,随后,将艉流场数据通过单向耦合的方式与直升机飞行动力学模型耦合,得到直升机在着舰过程受到的气动载荷与操纵量变化.从非定常载荷水平与操纵特性的角度,分析不同主动射流方案对舰船艉流场的非定常特征的影响.结果表明:射流装置安装在机库迎
目前的群智能疏散模型多仅考虑单一的经典的群体智能,不足以描述复杂的群体疏散行为特征,且鲜有考虑人群混乱程度对人群疏散的影响.为研究描述多种群体疏散行为的群智能疏散模型,综合使用多种群智能算法,并考虑了人群混乱程度对疏散的影响,构建了熵修正的混合人工蜂群-蝙蝠算法人群疏散模型.首先,采用DBSCAN(density-based spatial cluste-ring of applications with noise)算法进行群组划分.然后,将人群分为群组引导者、群组成员和离散人员3类,并针对每类人群的特