大规模复杂文档图像快速检索系统的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:cynthializzu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对包含不同分辨率、不同颜色灰度、中文、日文和英文等多种文字的大规模文档图像检索问题,提出了一种新的基于图像特征的文档图像检索方法。该方法在对文档图像进行预处理后,提取文档图像的密度分布特征(DensityDistributionFeatures,DDF),前景局部分布特征,和关键块特征(KeyBlockFeatures,KBF),页面几何结构全局特征,然后依靠密度分布特征对图像进行相似度匹配,再利用关键块特征对匹配产生的候选图像进行可靠性检测,最后给出检索结果。为了提高算法的检索效率,采用基于倒排文件思想的重叠索引技术。避免了检索阶段的逐一检测过程,从而大大缩小了匹配空间,有效地提高了检索速度。 在包含10,000多文档的大规模文档图像数据库上进行实验,结果表明上述方法可以有效地在包含不同分辨率、不同颜色深度、混合多种文字(中文、英文、日文)的大规模文档图像数据库中实现快速检索;平均的检索时间为2.42秒,前五名检索成功的准确率为:95.9%。
其他文献
超宽带通信技术以其强抗多径衰落、高速率、低功耗等优良特性而备受关注。超宽带系统利用纳秒及亚纳秒量级的极窄脉冲实现通信,使得系统对同步错误非常敏感,因此实现快速捕获
木霉菌(Trichoderma)是一类重要的生防真菌,具有适应性强、抗菌谱广、诱导植物抗性和多重拮抗作用机制等特点。木霉菌生防相关基因的表达由内源信号途径所调节,G蛋白介导的信
随着国民经济的发展和技术水平进步,人们的安防意识日益增强,对于视频监控系统的需求也越来越迫切。宽带移动视频监控系统已经成为视频监控系统的新技术和新要求,视频监控系统服
学位
摘要:随着社会的迅速发展,如今我们已经进入了一个信息时代,信息技术已经被运用于生活中的各个方面。因此,对于职业高中生来说,计算机的重要性毋庸置疑,培养他们在计算机课堂上的创新意识刻不容缓。并且随着传统的信息技术不断的被革新,相关学科教师的教学模式也同样需要创新。所以,相关学科教师要打破传统的教学模式,营造一个富有创新精神的课堂,提高中职生在计算机方面的创新意识。那么如何转变教学观念,创新教学模式,
本文详细地介绍了混沌振子理论在微弱信号检测中的应用,分析了duffing振子对参数的敏感性和对噪声的免疫能力,阐述了相图变化作为信号检测的理论依据。文章建立了微弱信号幅
水下警戒阵列新体系结构研究未来的战争,是信息的对抗;未来的水下警戒阵列,是网络在水下的延伸。中国海岸线总长度1.8万千米,水下警戒对国土安全意义深远。什么样的水下警戒阵列
随着通信技术和网络技术的发展,视频监控系统已进入数字化、无线化和智能化阶段。数字化、无线化的视频监控系统已成为安防领域的发展趋势。与传统视频监控系统相比,在某些特
随着计算机系统在航空、航天及一些军事等领域的应用,计算机系统的可靠性越来越成为人们关注的问题。在这些领域中,计算机一旦出现故障,就会导致巨大的经济损失,甚至会产生军事、
本文主要讨论JPEG图像中的隐写及隐写分析算法。文章首先介绍了信息隐藏的一些基本概念;然后研究和实现了目前流行的几种隐写算法;接着讨论了隐写分析技术的主要方法和理论,着重
极化SAR通过不同的极化天线发射与接收电磁波,能够获得丰富的目标散射信息,因而在遥感领域具有广阔的应用前景。从极化SAR数据中提取信息以实现遥感图像解译是当前的研究热点。