论文部分内容阅读
随着办公文档自动化处理需求的增大和手持摄像设备技术的迅速发展,基于相机采集的文档图像处理技术由于其广阔的市场潜力和前景,越来越受到研究者的重视。本文尝试探讨研究了相机采集中文文档自动处理的几个关键技术:
本文为相机采集文档的页面曲面选取可展曲面进行建模,并基于剖面投影和行内字间空白检测方法,设计了文档图像中的主副纹理流场估计算法。估计的文档页面表面网格,较好的展现文档页面的形状信息,为进行文档页面形状矫正提供坚实基础。
基于微分思想,并利用文档页面的纹理流场信息和可展曲面的母线性质,完成对透视投影平面的矫正方法并扩展应用到对连续拼接平面的矫正系统中。由实验结果看出,该算法有效的矫正了曲面文档图像,使矫正图像拥有较高的汉字识别率。
选用基于区域Voronoi分割图方法,融合背景空白版面分割算法,设计了基于双向综合的层次化文档版面结构分析算法框架,可以较好地完成矫正后的中文文档图像版面结构分析任务。实验结果证明,该系统具有良好的性能和较高的灵活性和推广性。