【摘 要】
:
自然场景下的文本检测与识别技术已成为近年来一个非常热门的研究课题。一方面,作为自然场景中文本信息提取的基础,自然场景下的文本检测与识别方法具有很高的研究价值;另一方面,在包括图像搜索、即时翻译和机器人导航等领域内的诸多应用场景中,高性能的文本检测和识别系统也有着重要的现实意义。针对现有的文本检测和识别方法中的不足。本文的研究主要有两个方面:一是研究满足自然场景中多方向、不规则文本的检测算法。二是如
论文部分内容阅读
自然场景下的文本检测与识别技术已成为近年来一个非常热门的研究课题。一方面,作为自然场景中文本信息提取的基础,自然场景下的文本检测与识别方法具有很高的研究价值;另一方面,在包括图像搜索、即时翻译和机器人导航等领域内的诸多应用场景中,高性能的文本检测和识别系统也有着重要的现实意义。针对现有的文本检测和识别方法中的不足。本文的研究主要有两个方面:一是研究满足自然场景中多方向、不规则文本的检测算法。二是如何在文本识别网络中充分利用文本的位置和视觉信息,提高无上下文的文本的识别准确性。为此,本文从以下几个方面开展研究:(1)嵌入重评分机制的自然场景文本检测方法。针对自然场景文本检测中存在大量假阳性问题,本文提出了嵌入重评分机制的自然场景文本检测方法,引入实例分割网络(Mask R-CNN)作为基本框架,设计实例掩膜重评分机制,完成对自然场景中多方向、不规则文本的检测。(2)基于位置信息增强的场景文本识别研究。针对基于注意力机制的编码器解码器框架中常用的长短期记忆网络(LSTM)往往会忽略某些位置或视觉信息,本文提出一种用于场景文本识别的位置信息增强的编码解码器(PIE)框架,通过一种附加的位置信息增强模块来弥补LSTM网络的不足。(3)针对本文提出的文本检测和文本识别模型,我们在多个综合场景文本数据集上进行了充分实验。实验证明,相对于各领域的主流方法,本文提出的文本检测和识别方法具有较强的实用性。
其他文献
纳米天线是把天线理论扩展到纳米尺度范围内,通过研究表面等离激元,将电磁波耦合到亚波长尺度空间内,从而实现电磁场的近场增强等功能。基于表面等离激元的纳米天线在能量吸收、光学成像和传感器等领域具有优异的表现和广泛的应用前景。单一结构的纳米天线存在吸收波段不宽等问题,往往很难达到宽波段的完美吸收要求。针对该问题,本文利用复合结构的多谐振特性,研究具有理想吸收的纳米天线。通过改变纳米天线的结构、尺寸、材料
随着通信需求的快速发展及密集型无线数据业务爆发式地增长,低能耗、高容量以及高可靠的弹性传输能力为高速移动无线通信提出了更高的挑战。为了满足高速移动毫米波网络的高质量链路通信及高能效传输的需求,混合预编码技术及中继协作技术在保证传输链路稳定和提高系统能效方面优势显著。通过利用中继辅助通信网络来额外构建信息链路以弥补毫米波衰落损耗,并结合混合预编码技术进一步提升系统的容量及能量效率。基于此,本文主要聚
量子不经意密钥分配(Oblivious Quantum Key Distribution,OQKD)是量子密码学中基础而又重要的安全技术,是一种具有易实现、低开销、高安全性等优势的不经意密钥分配方式。量子隐私查询是对称隐私信息检索问题与量子密码学相互渗透的新型查询方案,旨在保护通信双方的隐私安全,它可以保护用户方的隐私,防止数据库拥有者在用户查询数据时窃取用户隐私,同样也能够保证数据库安全性,防止
人群拥挤集聚条件下的突发事件通常伴随着极度的拥挤和混乱,恐慌情绪和高度密集的人群以及周边环境中大量不确定的事件信息,可能使人群纷纷涌向某个既定的安全出口而导致严重的公共安全事故。如何在公共事件突发后迅速、安全的疏散拥挤区域的人群成为各领域的研究热点。然而,在缺乏及时通畅的信息传达渠道的情况下,大量人群聚集条件下的混乱环境给安全疏散技术带来了挑战,成为长期的问题瓶颈。移动互联网的普及为这一问题补齐了
第五代移动通信技术(The Fifth Generation Mobile Communication Technology,5G)满足了网络流量呈指数型增长的趋势。为了连接更多的用户设备和提供更高的数据速率,通过在宏小区范围内灵活部署低功率小基站以避免盲区,形成了超密集网络。在这种部署方式下,能够有效地提高网络吞吐量以及控制网络平衡。然而,基站的密集部署和移动用户的增加,导致网络中能源消耗和干扰
随着人工智能领域的快速发展,人们对产品的自动化程度要求也越来越高。移动机器人的发展给人们的工作和生活带来了极大的便利,其中能够完成自主导航和定位是在复杂环境中执行任务的前提,此时同步定位与地图构建(Simultaneous Location And Mapping,SLAM)技术的重要性得以体现,而视觉里程计(Visual Odometry,VO)作为SLAM系统的前端,是移动机器人完成自主导航和
铅锌矿石是战略性资源,广泛应用于各个工业领域,对于国民经济的快速发展有着举足轻重的作用。随着高品位矿藏的枯竭,铅锌矿石利用率需提高,铅锌矿石分选越来越受关注。通过铅锌矿石分选,富集铅锌矿石,提高利用率,矿山企业能够做到不浪费,绿色发展。针对利用卷积神经网络对矿石进行智能分选时,难以同时提高矿石分类精确度和处理量的问题,提出基于知识蒸馏理论的铅锌矿石图像分类方法。本文以基于X射线成像技术的铅锌矿石图
油茶是一种可生产食用油料的茶树,其树根、叶片、茶籽以及茶壳都具有良好的生态经济效益。但是随着油茶种植面积的不断增加,各类侵害油茶树的病害也越来越多,其中油茶炭疽病是油茶产业普遍发生的一种破坏性极强的病害,而且目前也没有研制出有效的防治药剂,严重地影响了油茶产业的发展。因此及时准确地检测炭疽病,对油茶产业健康持续发展具有重大意义。本文提出了利用激光诱导击穿光谱(LIBS)技术,研究炭疽病油茶叶片中营
现今,随着无线通信技术的发展,从开始的1G到现在的5G出现,通信频段越来越细化的同时,对无线终端也提出了更高的要求。终端会向多功能、高性能、小型化等方向发展。然而对性能要求越高,其设备结构让电路会更加复杂,体积如何保持不变甚至进一步小型化成为难题,单凭射频前端的无源微波器件设计,无法满足现在的需求。滤波器和天线的一体化设计,能够使设计出的滤波天线不仅具有辐射、滤波、平衡变换等功能,还可以满足系统集