面向文字图像检索的关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:fengaitong1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,信息检索的作用日益凸显。特别是在图像检索领域,如何从海量的图像数据中快速、准确地寻找到我们期望的图像是一个十分重要且越来越热门的研究方向。基于内容的图像检索通常根据图像的视觉特征,计算特征间的相似度,并检索出相似图像。基于内容的图像检索已经运用到越来越多的领域,包括医学、电子商务、人脸识别等等。   “中华字库”工程的目标是建立全部汉字及少数民族文字编码字符集和主用字体字库。在对文字,特别是古文字的整理过程中,需要去除相同文字的重复字图,以保证一个未编码字只收集一次。检索出这样相似的字图对于文字学研究、数字图书馆等领域具有很高的应用价值。本文着重研究了在面向文字图像的检索系统中的若干关键技术,具体包括以下三个方面:   在图像预处理阶段,本文提出了一种基于背景估计与边缘检测相结合的图像二值化方法,该方法先利用Sauvola算法有效地估计图像的背景,并在此基础上,结合改进的Canny算法获取边缘变化信息,利用基于局部闽值的策略进行二值化。实验表明,在DIBCO2011数据集上,其效果与Otsu、Niblack、Sauvola经典方法相比有大幅提高。   在字图归一化和特征提取算法上,本文实现了若干种字图归一化的方法,并对比了基于像素的特征、基于SIFT的特征、梯度特征、链码特征与坐标归一化的链码特征提取算法在字图检索系统的效果,实验表明,基于修正的中心边界对齐归一化方法和梯度特征提取方法更适合字图数据。   在检索的速度上,本文分别研究了主成分分析与局部敏感哈希对检索速度的影响后,提出了一种基于主成分分析与局部敏感哈希索引相结合的快速检索策略。实验表明,提出的算法在保证检索质量的基础上,有效的减少了检索的时间,大幅提高了检索的效率。
其他文献
头部姿势估计是一个典型而复杂的模式识别问题,在人脸识别、虹膜识别、视线估计等研究领域有着广泛的应用前景,具有重要的学术研究价值。本文以Kinect传感器获取的RGB-D图像为
螺旋焊管广泛的应用于各种有关国计民生的重要环节,主要是用于石油、天然气的输送管线。我国螺旋焊管机组整体水平与国际先进企业相比,在数字化及生产自动控制方面还存在较大差
互联网技术的快速发展促进了经济与社会的发展,网上购物、娱乐与社交等互联网新兴事物的迅速普及为民众的现代生活提供了极大的便利。但与此同时,网络环境的复杂性和信息系统的
随着互联网技术的发展,网格将分布在广大地理区域上资源通过通讯技术连接起来,这样用户提交的原有的大型项目可以分割成多个独立的任务,可以在不同的网格资源上执行,并将执行的结
随着普适计算和物联网的发展,越来越多的新设备出现在实验室环境中,如RFID、智能传感器、PDU可编程电源控制器等。这些设备在实验室原有的设备(工作设备、环境调节设备、安防设
近年来,工业界和学术界花费大量的精力来构建大型知识库(如Freebase、Yago、Probase等),因为这些知识库可以用来提升信息检索、问答系统、情感分析等任务的结果。互联网技术的发
去隔行和缩放是增强视频显示质量的典型后处理方法。传统上,通常采用视频后处理芯片或CPU实现。由于专用视频后处理芯片研发及生产成本较高,而CPU对视频数据的处理效率较低,随着
随着信息技术的不断发展,信息化已经深入到了社会政治、经济、文化、生产、生活的各个领域,计算机网络已经成为人类生活、学习、工作等各方面不可缺少的工具。然而,伴随着网络在
在集成电路工艺以及微处理器性能需求的双重推动下,多核处理器逐渐取代单核处理器成为了市场的主流,微处理器的发展进入多核时代。当今大部分多核处理器采用共享存储的结构,各处
屏幕内容通常是指由电子设备的屏幕产生的视频或图像。随着计算机、平板电脑和智能手机等设备的迅速发展,屏幕内容在远程桌面、屏幕传输和云计算等应用中发挥着越来越重要的作