自然场景下的文本定位

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:dnaln_xcl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:首先阐述了文本定位的基本流程,然后列举了现有的主要文本定位方法,分析了基于区域、纹理、边缘、角点的文本定位方法和机器学习的文本定位方法的优缺点,详细说明了文本区域验证和文本块区域合并的方法,最后总结了各种文本定位方法。 全文查看链接   作为一种统计特征,纹理特征通常具有旋转不变性,因此基于纹理的分割方法具有一定的通用性,并且对于噪声有较强的抵抗能力。但是经常会出现文本区域与背景中的一些物体边缘相黏连的情况,这种情况就很难找出文本区域的精确边界。另外,纹理特征是在包含多个像素点的区域中进行统计计算,不是基于像素点的特征,因此当图像的分辨率发生变化时,所计算出来的纹理可能会有较大偏差。再者,原始图像有可能受多种因素的影响,比如:光照、反射因素,从二维图像中得到的纹理不一定是三维物体表面真实的纹理。 全文查看链接   潘道远等人[20]采用多方法融合的方法进行文本定位。他们首先使用金字塔分解把原始图像分解成大小不同的子图像,然后使用CROtsu算子对每一层子图提取边缘,并对子图分别进行数学形态学操作,去除孤立的背景,再使用先验知识规则去除一些非文本区,接着融合各个子图像,并使用最近邻插值法将融合图像放大为原图像的大小。将备选文本区的R、G、B三基色分别作为BP神经网络的输入参数,利用“米”字形网格结构神经网络分类为文本或非文本。这种方法通过融合基于边缘的方法和基于神经网络的学习方法,较为准确地实现自然场景文本的提取,由于备选文本区域的提取只采用了边缘信息,边缘不突出的文字常常被遗漏,因此该算法在处理边缘不明显的文本时,效果不太理想,同时将有些纹理比较复杂的背景区域错误的分类为文本区域。 全文查看链接   参考文献: 全文查看链接   [16] Qi W.Integrating Visual,Audio and Text Analysis for News Video[J].7th IEEE International Conferenee on Image Proeessing(ICIP2000),Vaneouver,British Columbia ,Canada,2008,7(3):10-13. 全文查看链接
其他文献
<正>edmunds.com:舒适操控的完美平衡宝马3系是宝马在美国市场的最畅销车型,市场欢迎这款车也是有理由的:这是一款漂亮的入门豪华车型,具有世界级的装配工艺,激动人心的动力
<正>以性能著称,并以后驱为荣的宝马,出了台前驱车,你会买账么?如今,基于UKL前驱平台的首款宝马218i运动旅行版就这样呈现在我们面前,不由得让人怀疑,宝马想做什么?其实也不
目的:通过研究类风湿关节炎(RA)患者血清IL-37和可溶性PD-1分子的表达水平,初步探讨其与RA的相关性以及临床意义。方法:收集RA患者及对照组人群的外周血,然后采用酶联免疫吸
伴随着国内经济的快速前进,信息现代化中各种先进科技逐渐应用到日常生活中,现在国民的生活水准也有了很高的发展,外出是人们每天都会做的事情,在外出中,桥梁起着关键的用途,是至关
冷凝器外侧的气流状态和温度分布对汽车空调系统性能有重要影响。受低温散热器、中冷器等散热元件布置位置的影响,流经散热元件的部分区域进风温度会升高、流速会降低,从而使
计算机是一种先进的现代化工具,它以其独特的高效率打入了国民经济的各个领域。由于计算机技术具有信息采集敏捷、处理快、控制灵活、时效性强、操作简单、劳动强度低等优点
本文通过分析营口市水资源现状及面临的问题,提出了解决问题的对策与方法,为实现营口市水资源可持续发展和利用提供了有益的参考。
大学公民教育的重要性正在全球范围内达成共识,公民教育课程体系建构是大学公民教育回归的关键路径。在新的时代背景下,韩国基于融合的课程理念,从公民教育课程的内部融合、
城市公共交通管理部门需要对城市公共交通运输能力与服务质量、优先落实水平、安全与应急保障水平、投资效益等进行监测与评估,宏观把握整个城市公共交通的发展水平。还应对公
该文针对物联网技术在平顶山特色经济煤炭、电力和化工中的应用,研究这些领域对物联网专业人才的技能要求和知识结构要求,并据此调整物联网工程专业课程体系结构,使培养的学生能更好服务平顶山地方经济建设。