基于线条结构和行结构特征的文本分割

来源 :中山大学 | 被引量 : 0次 | 上传用户:yuhuile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机运算速度和存储能力的提高,用计算机存储和处理越来越多的纸质文档成为可能。前人已经提出了从上到下和从下到上两大类分割方法,包括游程平滑法、轮廓投影切分法、哈夫变换等方法,以及利用近代数学成果的Gabor变换和小波变换等方法。本文利用文字的线条结构和文本块的行结构特性提出了一个新的提取文档图片中文本部分的方法。该方法首先用一模板对原图片S中每一点从四个方向判断该点是否为线条上的点,这样得到一个二值化矩阵B,B中为 1 点对应S中的线条上点。由于B中比较稠密的为1的点组成了一些不同的区域,则用一个区域搜索方法找到这些区域,同时将那些分散的为1的点抹去。另外本文假设文档图片中包含一个相对较大的文本块,故接下来按照区域大小从大到小的顺序,搜索一条通过区域左右或上下边界的直线,由于各个区域都是由比较稠密的为1的点组成的,所以该直线一定在最大的文本区域中找到,得到的直线倾斜度就是文档图片的倾斜度。然后根据找出的倾斜度对矩阵B进行投影,根据投影图来判定文本区域,最后根据判断结果对各个区域进行标记即可实现分割。该分割方法对语言和文档的倾斜度不敏感,并且还可得到很精确的文档倾斜度,并在实验中取得了良好的效果。
其他文献
实践表明,几乎所有的小学生都喜欢上美术课,喜欢画画.绘画是儿童普遍喜爱的一项美术活动.儿童作画时并未意识到是在为将来打绘画基础,而是在借助绘画这一形式表达自己的内心
本硕士学位论文讨论一维反应扩散方程的自适应有限元算法.首先,给出基于残量的误差估计指示因子,并证明它的有效性和可靠性.其次,基于此自适应指示因子,结合构造贪婪算法(CGS)和bul
近年来,随着计算机网络与通信技术、数字图像处理技术、多媒体技术的快速发展,传统的监控系统也不断向着新的方向发展。B/S模式适应了远程视频监控系统实现的需求和技术特点。
单调的变分不等式在实际中有很多应用,例如在最优控制和凸规划中,有很多解决此类问题的方法.这篇文章中变分不等式是带有不等式约束的,其中映射F是可分离的,且我们只知道F的函数值
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
近年来互联网的迅猛发展,为人们提供了海量的、动态的Web网页信息。但互联网的信息具有数量庞大、更新速度快、分散无序等特点,使信息检索、聚类及信息挖掘成为重要的研究课题
做市商,意指在金融市场上公开报出证券的买入价和卖出价并随时按照其报出的价格进行交易的经纪商或银行。这些金融机构对具体数量、种类的证券报出买入价和卖出价,一旦交易对手
在交换经济里,众多学者们已经得出了很多不可能定理,例如SerizawaS.先后得出:在古典、齐次和光滑的定义域上,不存在防止策略性操纵、帕雷托有效和个人理性的社会选择函数(Serizaw
本文主要研究Caratheodory函数类中的多重边界Nevanlinna-Pick插值问题(BNP(C)问题).本文应用改进的Toeplitz向量方法详细刻画了BNP(C)问题与一类带有限质量约束的三角矩量问
本论文主要讨论无穷维Hamilton系统的多辛几何算法。与辛几何算法的主要差别是,多辛算法不仅在一定的边界条件下保持系统的离散空间上的辛形式之和,而且能够保持局部的辛形式,从
学位