论文部分内容阅读
视频中的文本是视频的重要内容之一,其定位、分割、提取对视频图像的编辑、修复、及图像检索等研究有重要作用。其研究有一定的理论意义及实际应用前景。本文主要针对视频图像,研究其中文本的检测、定位和分割方法。
论文的研究工作主要包括以下几个方面:
1、提出了一个多特征自适应局部阈值的文本区域分割方法。该方法在模板覆盖的局部区域,根据文本边缘的强度、密度、水平和竖直边缘数之比生成自适应局部阈值,分割文本边缘。
2、给出了一个文本检测及定位方法。该方法首先对边缘图中的长直线进行消除,减少其对文本定位的影响,然后采用自顶向下的定位方法定位文本。实验表明:该方法能够较好的从边缘图中定位文本区域。
3、完成了一个实验性的视频文本检测软件系统。该软件系统应用论文中的方法,首先读入视频文件并分解成单帧图像,再在图像中检测文本区域。根据用户的选择,可以生成检测结果视频文件,用于视频演示,也可以显示中间处理过程。系统运行稳定,能获得较好的检测结果。
为了测试该文本检测算法的性能,使用所捕获的视频图像对其测试,并与Michael算法进行对比。结果表明,该视频文本检测方法具有较高的精度和召回率,可用于视频搜索、图像分割和图像修复等。