【摘 要】
:
文字是人类最早记录的信息之一,也是人类开始相互沟通交流的标志之一。自然场景文字是现代社会各种场景中不同信息的载体。因此,检测定位出自然场景文字对于人类社会活动来说有着重要的意义。在实际生产生活中,自然场景文本检测应用广泛,如智能工厂、车牌识别和证件识别等。基于文字信息的重要性,学界早在上个世纪就已经开始了相关的研究。深度学习兴起后,场景文字检测领域也涌现出了大量优秀的研究来解决场景文本检测问题。然
论文部分内容阅读
文字是人类最早记录的信息之一,也是人类开始相互沟通交流的标志之一。自然场景文字是现代社会各种场景中不同信息的载体。因此,检测定位出自然场景文字对于人类社会活动来说有着重要的意义。在实际生产生活中,自然场景文本检测应用广泛,如智能工厂、车牌识别和证件识别等。基于文字信息的重要性,学界早在上个世纪就已经开始了相关的研究。深度学习兴起后,场景文字检测领域也涌现出了大量优秀的研究来解决场景文本检测问题。然而由于场景文字存在尺寸变化大、位置随机和场景复杂等一系列难点问题,现有的方法在场景文字检测领域受到了一定的限制。因此本文基于深度学习方法,采用不同的特征增强方法对提及的相关问题进行一系列研究:(1)本文提出了一种基于层级特征增强的快速自然场景文本检测方法。在自然场景文本检测领域中,该方法首次关注了卷积神经网络中不同卷积块特征之间的关系。该算法基于卷积神经网络中的不同层次、尺寸的特征,分别预测出不同卷积块特征融合时的权重,并依据权重自适应地融合不同尺寸的特征,从而解决文本尺寸变化的问题。由于该方法根据权重动态地融合不同尺寸的特征,因此可以处理场景中大小不一的文字,较好地解决了文本尺寸变化剧烈的问题。同时,该方法的有效性在多方向文字数据集和曲形文字数据集上均得到了较好的验证。(2)本文提出了一种基于空间特征的特征增强方法。该方法适用于快速自然场景文本检测。由于文本可能出现在任意场景中的不同位置,具有很强的随机性,因此该方法将空间信息融入到层级特征中,增强了卷积神经网络的空间特征,从而解决了自然场景中文本区域位置随机的问题。该模型不仅检测更加精准、耗时少,而且拥有检测长文本、减少文本断连和减少误检等多项优势。该算法的精度和速度在多类数据集上得到了有效验证。(3)本文提出了一种基于特征补全的快速自然场景文本检测方法。现有的快速自然场景文本检测算法往往存在文本特征提取能力差等缺点,制约了相关研究的发展。本算法能够通过一种机制,自适应地捕捉到需要增强的区域,对其进行特征补全,增强快速自然场景文本检测算法提取文本特征的能力,从而在速度和精度上实现了提升。该算法精度在不同的数据集上均有提升,在部分数据集上可以与强特征提取算法精度相媲美。基于自然场景中文本的现有问题,本文展开了相关的探讨和研究,提出了一系列快速自然场景文本检测算法。提出的算法针对相关的问题做出了相应的改进,得到了预期的效果。随后本文总结了算法的优缺点,并展望了相关领域的后续研究发展方向。
其他文献
为公平定价以及降低风险损失,研究了公平关切和风险规避对网约车平台定价及线下打车价格决策的影响.运用逆向归纳方法,建立四种完全信息动态博弈模型,分析比较了在有无公平关切和风险规避情况下的最优定价策略,最后通过数值分析验证模型所得结果.研究表明:随着公平关切程度的增加,在某一范围内,线下打车价格下降,平台期望利润减少;随着风险规避程度的增加,线下打车价格提高,而平台定价降低.该研究可以为网约车平台定价
在大功率应用场合,单个有源电力滤波器(Active Power Filter,APF)由于容量的限制往往不能补偿所有的谐波,这时要求多个APF以模块化形式并联运行以提高容量。APF并联系统的性能由单台APF的控制技术和APF并联系统控制技术共同决定,而现有的APF并联系统在这两方面都还有提升的空间。本文就这两方面的问题展开研究。单台(并联型)APF本质上是一台并网逆变器,快速的电流控制方法有利于提
背景弥漫性大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)是成人恶性淋巴瘤中最常见的一种类型,由B细胞的克隆性增殖导致,B细胞表型及功能改变在DLBCL的发病机制中具有重要作用。肿瘤分期和病毒感染对于DLBCL患者治疗方式的确定和预后的评估具有重要意义。利妥昔单抗加上环磷酰胺、阿霉素、长春新碱和泼尼松(即R-CHOP治疗方案)的应用使DLBCL患者的生存率明
自新一轮电力体制改革启动以来,我国电力市场建设在引入市场竞争机制、还原电力商品属性等方面取得阶段性成果。与此同时,为缓解日益严峻的生态环境形势,实现2030年前碳达峰,2060年前碳中和目标,我国清洁能源领域发展迅速,装机容量持续增长。在现货市场改革稳步推进和清洁能源渗透率加速提升的双重背景下,研究设计市场交易机制对于保障电力系统安全经济运行,发挥价格引导资源配置作用,提升清洁能源消纳能力具有重要
肉品是人类餐桌上的必需品,随着人口数量的增加,人类对肉品的需求也逐渐增多。目前,肉品分割和检测环节仍有部分工序为人工密集型工种,随着科技的发展,自动化流水线正在逐渐代替人工,新冠疫情的爆发更是加速了肉品分割行业加工检测的无人化进程。然而肉品等为天然物品,纹理复杂,个体差异性特征显著,油脂等缺陷与本体颜色接近,使得自动化检测存在一定挑战。本文以自动化生产线上分割鸡胴体得到的翅尖、翅中、翅根、鸡胸自动
腐蚀是海洋工程材料应用过程中面临的巨大问题,而在金属中超过20%的腐蚀是由微生物造成的,因此微生物腐蚀不容忽视。为了减少工程材料受微生物腐蚀的影响,研发新型抗微生物腐蚀的涂层材料是一项重要课题。铁基非晶涂层是一种兼具优异耐蚀性能与耐磨性能的新型表面涂层材料,在海洋工程领域展现出诱人的应用前景。然而,目前有关铁基非晶涂层的腐蚀行为研究主要集中在常规环境,有关微生物环境下铁基非晶涂层的腐蚀性能与腐蚀机
研究背景近现代外科手术的快速发展和手术量的增加使得术后疼痛的患者群体逐渐增多,但现今的术后疼痛管理仍然不是最理想的。全世界每年接受手术的患者中有将近10%发展为慢性术后疼痛,这其中有部分可能是由于术后急性疼痛管理不充分所导致。目前,阿片类药物仍然是临床急性术后疼痛管理中最主要的药物,但是恶心,呕吐等副作用大大限制了患者的依从性,且有药物滥用的风险。因此临床上亟需新的镇痛方法。河豚毒素(tetrod
硅基光传感器凭借着工艺成熟、性能稳定、造价低廉等优势在探测领域被广泛使用,但是在重要的紫外光区域由于硅的吸收强度增大,加剧了光生载流子在表面的复合速率而使其探测响应不尽人意。利用稀土离子的下转换荧光效应将紫外光转化为响应度更高的可见光是一种比较有效的解决办法。本文根据Tb4O7掺杂浓度的不同制备了一系列Na PO3-Ba F2-Al F3-Ca F2体系氟磷酸盐玻璃(简称NBAC玻璃)。除了掺杂浓
研究背景:缺血性脑梗塞是中枢神经系统最常见疾病之一,具有发病率高、致残率高、死亡率高和经济负担重等特点,严重危害患者的健康生活水平,制约社会经济的快速发展[1]。目前,组织型纤溶酶原激活剂(rt PA)是唯一被美国食品药品管理局批准用于治疗急性缺血性脑梗塞的溶栓药物,但其有效治疗时间窗局限于发病4.5小时以内,而超过这一时间窗的rt PA溶栓治疗,将会明显增加出血性转化(HT)风险,加重脑卒中患者