基于分割的任意形状场景文本检测

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:usermin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的发展,自然场景文本检测的性能获得了显著的提升.但目前仍然存在两个主要的挑战:一是速度和准确度之间的权衡,二是对任意形状的文本实例的检测.本文采用基于分割的方法高效准确的检测任意形状场景文本.具体来说,使用具有低计算成本的分割头和简洁高效的后处理,分割头由特征金字塔增强模块和特征融合模块组成,前者可以引入多层次的信息来指导更好的分割,后者可以将前者给出的不同深度的特征集合成最终的特征进行分割.本文采用可微二值化模块,自适应地设置二值化阈值,将分割方法产生的概率图转换为文本区域,从而提高文本检测的性能.在标准数据集ICDAR2015和Total-Text上,本文提出的方法使用轻量级主干网络如ResNet18在速度和准确度方面都达到了可比较的结果.
其他文献
信息化无疑是现代社会最显著的特征,它迅速地改变着世界的面貌和人们的生活方式,以前所未有的速度渗透到社会的方方面面。历史的车轮驶进了网上办公和电子政务时代,信息化建
期刊
本文针对智能窗帘控制系统在实际使用过程中的抗干扰性和鲁棒性要求,在传统PID调节的基础上,设计了一种用于智能窗帘系统自动锁光的双模糊控制算法,通过对直流电机输入电压和
本文针对传统SURF (Speeded Up Robust Features)算法精度和速度较低的问题,提出一种优化的图像匹配算法.在特征点提取阶段引入局部二维熵来刻画特征点的独特性,通过计算特征点的局部二维熵并设置合适的阈值来剔除一部分误点;在匹配阶段用曼哈顿距离代替欧式距离,并引入最近邻和次近邻的概念,提取出模板图像中特征点与待匹配图像中特征点曼哈顿距离最近的前两个点,如果最近的距离除以次近的