基于卷积神经网络的图像文本检测方法实现

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:catbull
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本是人类交流的重要信息载体,与人类的日常生活息息相关。以图像的方式进行文本信息的传播是十分常见的,在获取到包含文本的图像后,将其中的文本进行检测定位,也是极为重要的。随着深度学习与卷积神经网络的发展,许多与图像相关的研究工作得到了很大的进展,同时也出现了许多基于卷积神经网络的图像文本检测方法。这些方法在面对复杂场景的图像时,也能产生准确的图像文本检测结果。但在处理相邻文本,弯曲文本等形态多变的文本对象时,依旧存在着一些问题。针对这些问题,本文在卷积神经网络架构的基础上,提出了新的解决方案,主要内容有:(1)提出了一种改进EAST的图像文本检测方法,引入了更深层次的卷积神经网络架构进行特征提取,使网络的能提取到图像更深层的抽象语义信息,有利于文本对象的特征归类,有效地解决了原方法召回率过低的问题,并提升了整体的检测效果;在预测时,引入了文本的双边信息,用于构建完整的文本对象、准确地定位各种尺度的文本对象。(2)提出了一种基于文本三区域分割的场景图像文本检测方法,在进行分割处理时,将图像的文本实例分别映射到整体区域、核心区域和边框区域中,以获取图像的文本实例在上述三个区域的分割图像;在网络的训练中,利用整体区域分割图和边框区域分割图来指导核心区域分割图的生成,产生更准确的分割图像;基于分割图像获取文本的准确定位,解决了相邻文本的分离问题,提升了整体的检测效果,同时也实现了图像中弯曲文本的准确定位。(3)设计并实现了一个基于文本三区域分割的场景图像文本检测方法的图像文本检测演示系统,将抽象的检测算法直观地进行体现,在进行实际应用时,对后台的复杂算法框架进行封装;使用简洁的页面,完成图像文本检测工作的展示,实现了理论与应用的有机结合。
其他文献
随着化石能源储量的日益衰减以及温室效应的逐渐加剧,国际社会对于清洁可持续能源的生产、存储及使用也越来越关注。充分利用好风能,潮汐能和太阳能等可再生能源,就需要进行高效能量存储,并在使用时能进行高效的能量释放。锂离子电池是现在最为热门的储能器件,它有着体积和质量能量密度高,循环性能优异,可靠性好等优点,但是储能领域及大功率动力电池等应用场景对锂离子电池的快速充放电能力提出了更高的要求。相比于层状结构
随着环境污染问题的日益加剧,利用太阳能处理污水的技术得到了广泛的关注,半导体光催化剂具有可直接利用太阳能、降解能力强等优势。具有独特压电催化性能的钛酸钡是一种新型的光催化剂,逐渐成为催化领域的研究热点。本论文采用溶剂热法制备四方相BaTiO3,利用其压电催化性,辅助传统光催化进行协同降解染料,设计了BaTiO3基复合催化材料,详细研究了催化体系降解机理。据此,本论文开展了以下工作:1.纯相BaTi
随着如今轻量化及节能减排标准的不断提高,交通运输、航空航天和军工等行业的高质量发展亟需高性能的轻质合金材料。与传统的黑色金属相比,铝基复合材料具有多种性能优势,如密度低、比强度高、良好的导电性和抗蠕变能力等,因此得到了人们的广泛关注。然而经过人们长期对铝基复合材料的研究发现,均匀组织结构的铝基复合材料在性能上的提升已经达到了瓶颈阶段,因此许多科研工作者研究的焦点开始转向非均匀组织结构的铝基复合材料
随着科技和新能源的发展,超级电容器作为一种同时具备高能量密度和高功率密度的储能器件,受到了广泛关注。利用阳极氧化的方法在钛片上制备的TiO2纳米管膜,具有高比表面积和良好的电化学性能;且钛基底可直接作为集流体,这使得TiO2纳米管膜成为超级电容器的备选电极材料之一。本文主要研究了钛片和钛合金的阳极氧化,对TiO2纳米管和钛合金复合氧化物纳米管进行掺杂改性,旨在改善基于TiO2纳米管电极的超级电容器
为抑制分布式电源大量接入时低压配电网电压三相不平衡,本文研究了一种低压配电网三相四线系统中三相电压不平衡治理的电路拓扑结构及其控制方法。根据低压配网的实际情况及其三相不平衡的特性,基于背靠背直流输电的原理,设计了配电网三相自平衡装置,搭建了配电网三相自平衡装置的拓扑结构和电路模型、阐述了该装置的工作原理和控制策略,并分析了实现三相电压平衡的原理。通过仿真建模验证新装置的合理性与科学性。利用simu
发射药是身管武器的重要组成部分,在一定程度上决定了身管武器的作用威力。发射药的传统制造需要利用模具,难以满足复杂结构的需求。3D打印技术是一种以数字文件为基础的、将材料逐层累加成实体物品的数字化快速成型制造技术,能够满足发射药无需实体模具即可成型的要求,能够快速精密制备出所需发射药,具有研发周期短、按需打印、安全性高等特点。针对发射药粘度高、不能加热等问题,基于挤出成型原理和溶剂法制备的特点,考虑
为了研究出一种静电防护性能良好,能量输出大,工艺简单的火工品,本文设计制作了一种以非晶碳膜作为换能元材料的电火工品,并对其点火性能和作用机理进行了初步的研究,主要内容如下:(1)利用气溶胶辅助化学气相沉积(AACVD)的方法制备了厚度约为2μm、表面平整致密、与氧化铝陶瓷基底结合力强、电阻可调的非晶碳膜。并通过对不同沉积温度、沉积时间、载气流量以及沉积区间下制备的碳膜进行表征分析,建立了沉积条件与
固体氧化物燃料电池(SOFC)发电效率高,可以直接使用碳氢燃料,在大型集中供电、分布式发电、家用热电联供乃至交通领域都有潜在应用前景。其中,最关键的任务之一是制备出在各种燃料中都能高效工作且具有成本竞争力的电极材料。与Ni-YSZ相比,氧化物陶瓷阳极的电导率低,极化阻抗大,电池性能较差。通过原位析出在其表面引入纳米金属颗粒,可以显著提高电化学催化活性,同时抑制积碳反应的发生。本文以SrFeO3钙钛
高光谱图像数据具有高分辨率特性,它蕴含了丰富且详细的地物光谱信息,这一数据特点可以极大地提高其识别地面目标的能力,尤其对于识别那些在影像上呈现小像素甚至亚像素的目标。因此,高光谱遥感技术被广泛应用于气体检测、地质识别、军事侦察和海洋监测等多个领域。高光谱遥感图像的目标检测是高光谱遥感技术的一个重要技术,它实质上是一个二值假设检验问题,即判断每一个像元的归属类别是背景还是目标,进而得到地物的检测结果
无人驾驶车辆是未来国内外汽车产业的发展方向,在行车安全、社会经济效益、科学技术发展等多领域有极为重要的战略地位。为了提高无人驾驶系统感知精度,保障行车安全,本文对无人驾驶车载传感器数据采集与处理系统中关键技术展开研究,主要研究内容如下:(1)基于无人驾驶车载传感器类型设计了具备相应接口的传感器数据采集与处理系统计算平台。首先,分析无人驾驶感知系统需求确定硬件设计方案。然后,基于高性能低功耗的Jet