论文部分内容阅读
[摘 要]现如今,在工程建设中,对工程图纸进行检索和整理才能发挥图纸资料的重要作用,在实际的工作中,进行图纸的检索也是现代化建设的重点。要结合图纸的特点,应用科学的图像处理技术,深入研究图纸检索的相关技术和手段。本文主要从基于内容的工程图纸检索技术方面进行研究,希望能够给相关的工作人员提供借鉴和参考。
[关键词]基于内容;工程图纸;检索技术;研究
中图分类号:U442.6 文献标识码:A 文章编号:1009-914X(2015)06-0027-01
和传统的图纸检索技术相比,基于内容的检索技术需要对工程图纸进行预处理,主要采用图像处理技术。以图纸的特征为主要依据,形成较为系统的检索模式。这种方式对工程的建设工作做出了重要的贡献,技术人员需要对这种技术进行掌握,明确图纸检索的重要性,借鉴传统检索技术的优点,完善现代的工程图纸检索技术。
一、图纸预处理
在以往的工程图纸检索技术的运用中,主要以关键词的检索为主,这种方式的运用存在着较为严重的局限性,无论是在实物还是在软件的处理上都体现出一定的难度。在实际的应用中,用户都是通过一张较为模糊的图纸来自行搜集相关的内容,这就是所谓的图纸检索。在工程图纸进行扫描之后会呈现出某种图像格式,为了计算的便利,可以在经过扫描的图纸中找到相关的信息,设置为通用的格式,在这一过程中要明确图纸的属性以及重要特征,所以说,需要做好对图纸的预处理工作。预处理工作是一项较为繁琐的问题,首先要对图纸的形态进行优化,达到去噪、锐化以及标准化的效果。最终对图纸进行统一管理,有助于检索和分类。
基于内容的工程图纸检索技术包含图像处理、模式识别在其中,其发展具有一定的优势。可以为图像信息的处理以及图像访问提供支撑和动力。在进行图像检索的过程中,主要是将图像信息作为重要的载体。其形象性和直观性较为突出。通常情况下,图像在扫描的过程中都需要以其基本特征为重点。从现如今技术人员对于图像内容的了解程度上可以看出,底层、中层和高层的视觉特征较为突出。对图像特征进行提取和检索就是充分利用其多维的视觉空间,建立智能化和自动化的图像索引系统,将这一技术应用到实际的工程图纸检索技术当中。
三、基于内容的工程图纸检索技术的局限
在这种图纸检索技术运用的过程中也会存在着严重的问题,主要表现在以下三个方面:
1、查准率较低。从现如今的工程图纸检索方面来看,很难达到令人满意的程度,在进行图纸中图像查询的过程中,很难从众多张图纸中找到最为合适的那一张,不仅浪费时间,而且严重地阻碍了工程的运行。
2、对图纸中的相关信息的提取程度不够。在进行图纸检索技术中可以看出,主要依据图像的特征来进行技术检索,这一做法和实际的标准相脱离。因为低层的视觉特征很难对图像中所包含的有用信息进行检测,对于图像的识别起到一定的阻碍作用。
3、用户查询接口不理想。在较为理想的图像检索系统中,通过对用户的查询接口进行检测,可以不断提升用户之间的交互能力,而且对于图像的检索也比较直观。但是当前的图像搜索引擎的用户使用量较低,而且呈现出一定的单一性。需要一定的搜索引擎才可以完成。
四、基于内容的图纸检索技术的发展方向
从现如今图像检索技术的发展趋势上来看,在未来的发展中需要不断提升图像的查准率,同时,查全率和速度都应该有所提升。具体来说,主要可以从以下几个方面进行考虑:
图像数据模型是基于内容图像检索(CBIR)系统的核心,模型决定了系统的检索能力。一般来说,建立的数据模型要能够充分反映媒体对象的内容,能够有效支持存储的物理特征和逻辑特征,能够表达无结构的图像实体,并可由基本图像特征构造复杂的图像特征,能根据特定领域知识从图像特征导出图像语义特征,支持空间推理。然而现有的图像数据模型还不足以满足这些要求。因而有必要研究更为合理的图像数据模型,以支持基于内容的图像检索技术的发展。目前有人提出将图像数据模型按逻辑结构划分为5层,从低层到高层分别为:特征组织与特征索引层、特征表示层、图像特征层、语义特征层、用户视图层。
2、有效的特征提取
特征提取是CBIR技术的关键。以往的研究大多从颜色、纹理和形状的模式匹配角度处理这个问题。但是从用户的角度来讲,相似性是一个非常主观化的评价准则,用户对图像的感知关系到视觉、心理等方面,用量化的距离标准来测试两幅图像的相似度仍会出现令人意想不到的结果。Rogowitz等人通过一系列的实验从精神物理学角度来分析人类对图像内容的感知力,从实验中得出:尽管利用颜色直方图、纹理、形状模型这些视觉特征还不能完全准确地描述出图像的含义,但与语义表述之间还是有一定的联系。现在需要做的工作是如何提取更能够表述人类对图像感知的特征,如何使得这些底层的视觉特征与图像的含义关联得更紧密。
将特征提取和所涉及到的应用领域联系起来也有利于提高效率,因为不同应用领域的图像或图形会有一些独有的特征,例如黑白商标图案的区别主要在于图案形状,彩色照片主要是色彩分布及位置等,这样就必须根据不同的特点设计不同的匹配算法,这将涉及到相关领域知识。同时,用户希望能够自主地选择性提取和相似匹配的算法。
3、高层语义和低层特征的关联
人们在日常生活中不自觉地倾向于使用高层的语义概念,如,“楼房、汽车、海滩”等。因而当前研究图像检索的重点和难点集中在如何在抽取的图像特征和图像内容所表示的语义特征间建立很好的联系,也就是说,由于我们所拥有的特征并不能很好地体现图像真正的语义信息,以至于检索的结果往往不能令人满意。目前,在图像的低层特征方面的研究已做了很多,语义特征提取方面也取得了一些研究成果,但在高层语义与低层特征的关联方面仍存在着以下问题:如何从视觉特征中提取出语义特征;
4、高维索引技术
对于大容量的图像数据库,在基于内容的检索过程中,特别是在组合检索中,特征矢量的维数常常高达数十甚至上百维,大大多于常规数据库的索引能力;另一方面,由于现有的多维数据的索引技术是针对传统数据库设计的,所有相似索引的基本思想都是根据特征数据集在特征空间中的分布特性,将数据切分成子数据集,并对子数据集建立描述。但是,由于图像索引本身的近似性、无序性以及图像属性的多重性等特点,传统数据库的许多索引结构都无法用来描述图像的索引组织。此外,这些索引算法还随着特征维数的增加搜索时间以指数形式增加,因此非常需要研究新的索引结构和算法以支持快速检索。
5、综合的多特征检索技术
图像内容具有各种视觉特征以及视觉对象的空间关系等。不同的特征,有不同的矢量表示方法和相似性度量准则,即使是同一特征,如颜色特征,也有直方图特征、颜色距、颜色集等多种特征表示法。
在用单一特征检索时,可能出现相似度量接近的两幅图在语义上相差较大,而利用多特征综合检索,语义上不相关的图像虽然在某一特征描述上有很好的相似度,但是同时在其他特征描述上也取得好的相似度的几率是非常小的。另外,多特征综合检索便于用户更灵话、更有效地表达查询要求。
五、总结
总之,图像检索技术的研究是一个涉及到多个领域的综合性课题,是对计算机视觉技术、数据库检索和管理技术、人工智能技术、数学建模技术、图像分析处理技术、计算机网络技术以及人类心理学等各个方面成果的融合,只有这样才能建立一个高效、快速、实用的图像检索系统。
参考文献
[1] 周文昭.基于内容的图像检索系统的最新进展.计算机工程与应用,2002(26):112-115.
[2] 谢毓湘.基于内容的图像检索技术研究.计算机工程与应用,2002(01):37-38.
[关键词]基于内容;工程图纸;检索技术;研究
中图分类号:U442.6 文献标识码:A 文章编号:1009-914X(2015)06-0027-01
和传统的图纸检索技术相比,基于内容的检索技术需要对工程图纸进行预处理,主要采用图像处理技术。以图纸的特征为主要依据,形成较为系统的检索模式。这种方式对工程的建设工作做出了重要的贡献,技术人员需要对这种技术进行掌握,明确图纸检索的重要性,借鉴传统检索技术的优点,完善现代的工程图纸检索技术。
一、图纸预处理
在以往的工程图纸检索技术的运用中,主要以关键词的检索为主,这种方式的运用存在着较为严重的局限性,无论是在实物还是在软件的处理上都体现出一定的难度。在实际的应用中,用户都是通过一张较为模糊的图纸来自行搜集相关的内容,这就是所谓的图纸检索。在工程图纸进行扫描之后会呈现出某种图像格式,为了计算的便利,可以在经过扫描的图纸中找到相关的信息,设置为通用的格式,在这一过程中要明确图纸的属性以及重要特征,所以说,需要做好对图纸的预处理工作。预处理工作是一项较为繁琐的问题,首先要对图纸的形态进行优化,达到去噪、锐化以及标准化的效果。最终对图纸进行统一管理,有助于检索和分类。
基于内容的工程图纸检索技术包含图像处理、模式识别在其中,其发展具有一定的优势。可以为图像信息的处理以及图像访问提供支撑和动力。在进行图像检索的过程中,主要是将图像信息作为重要的载体。其形象性和直观性较为突出。通常情况下,图像在扫描的过程中都需要以其基本特征为重点。从现如今技术人员对于图像内容的了解程度上可以看出,底层、中层和高层的视觉特征较为突出。对图像特征进行提取和检索就是充分利用其多维的视觉空间,建立智能化和自动化的图像索引系统,将这一技术应用到实际的工程图纸检索技术当中。
三、基于内容的工程图纸检索技术的局限
在这种图纸检索技术运用的过程中也会存在着严重的问题,主要表现在以下三个方面:
1、查准率较低。从现如今的工程图纸检索方面来看,很难达到令人满意的程度,在进行图纸中图像查询的过程中,很难从众多张图纸中找到最为合适的那一张,不仅浪费时间,而且严重地阻碍了工程的运行。
2、对图纸中的相关信息的提取程度不够。在进行图纸检索技术中可以看出,主要依据图像的特征来进行技术检索,这一做法和实际的标准相脱离。因为低层的视觉特征很难对图像中所包含的有用信息进行检测,对于图像的识别起到一定的阻碍作用。
3、用户查询接口不理想。在较为理想的图像检索系统中,通过对用户的查询接口进行检测,可以不断提升用户之间的交互能力,而且对于图像的检索也比较直观。但是当前的图像搜索引擎的用户使用量较低,而且呈现出一定的单一性。需要一定的搜索引擎才可以完成。
四、基于内容的图纸检索技术的发展方向
从现如今图像检索技术的发展趋势上来看,在未来的发展中需要不断提升图像的查准率,同时,查全率和速度都应该有所提升。具体来说,主要可以从以下几个方面进行考虑:
图像数据模型是基于内容图像检索(CBIR)系统的核心,模型决定了系统的检索能力。一般来说,建立的数据模型要能够充分反映媒体对象的内容,能够有效支持存储的物理特征和逻辑特征,能够表达无结构的图像实体,并可由基本图像特征构造复杂的图像特征,能根据特定领域知识从图像特征导出图像语义特征,支持空间推理。然而现有的图像数据模型还不足以满足这些要求。因而有必要研究更为合理的图像数据模型,以支持基于内容的图像检索技术的发展。目前有人提出将图像数据模型按逻辑结构划分为5层,从低层到高层分别为:特征组织与特征索引层、特征表示层、图像特征层、语义特征层、用户视图层。
2、有效的特征提取
特征提取是CBIR技术的关键。以往的研究大多从颜色、纹理和形状的模式匹配角度处理这个问题。但是从用户的角度来讲,相似性是一个非常主观化的评价准则,用户对图像的感知关系到视觉、心理等方面,用量化的距离标准来测试两幅图像的相似度仍会出现令人意想不到的结果。Rogowitz等人通过一系列的实验从精神物理学角度来分析人类对图像内容的感知力,从实验中得出:尽管利用颜色直方图、纹理、形状模型这些视觉特征还不能完全准确地描述出图像的含义,但与语义表述之间还是有一定的联系。现在需要做的工作是如何提取更能够表述人类对图像感知的特征,如何使得这些底层的视觉特征与图像的含义关联得更紧密。
将特征提取和所涉及到的应用领域联系起来也有利于提高效率,因为不同应用领域的图像或图形会有一些独有的特征,例如黑白商标图案的区别主要在于图案形状,彩色照片主要是色彩分布及位置等,这样就必须根据不同的特点设计不同的匹配算法,这将涉及到相关领域知识。同时,用户希望能够自主地选择性提取和相似匹配的算法。
3、高层语义和低层特征的关联
人们在日常生活中不自觉地倾向于使用高层的语义概念,如,“楼房、汽车、海滩”等。因而当前研究图像检索的重点和难点集中在如何在抽取的图像特征和图像内容所表示的语义特征间建立很好的联系,也就是说,由于我们所拥有的特征并不能很好地体现图像真正的语义信息,以至于检索的结果往往不能令人满意。目前,在图像的低层特征方面的研究已做了很多,语义特征提取方面也取得了一些研究成果,但在高层语义与低层特征的关联方面仍存在着以下问题:如何从视觉特征中提取出语义特征;
4、高维索引技术
对于大容量的图像数据库,在基于内容的检索过程中,特别是在组合检索中,特征矢量的维数常常高达数十甚至上百维,大大多于常规数据库的索引能力;另一方面,由于现有的多维数据的索引技术是针对传统数据库设计的,所有相似索引的基本思想都是根据特征数据集在特征空间中的分布特性,将数据切分成子数据集,并对子数据集建立描述。但是,由于图像索引本身的近似性、无序性以及图像属性的多重性等特点,传统数据库的许多索引结构都无法用来描述图像的索引组织。此外,这些索引算法还随着特征维数的增加搜索时间以指数形式增加,因此非常需要研究新的索引结构和算法以支持快速检索。
5、综合的多特征检索技术
图像内容具有各种视觉特征以及视觉对象的空间关系等。不同的特征,有不同的矢量表示方法和相似性度量准则,即使是同一特征,如颜色特征,也有直方图特征、颜色距、颜色集等多种特征表示法。
在用单一特征检索时,可能出现相似度量接近的两幅图在语义上相差较大,而利用多特征综合检索,语义上不相关的图像虽然在某一特征描述上有很好的相似度,但是同时在其他特征描述上也取得好的相似度的几率是非常小的。另外,多特征综合检索便于用户更灵话、更有效地表达查询要求。
五、总结
总之,图像检索技术的研究是一个涉及到多个领域的综合性课题,是对计算机视觉技术、数据库检索和管理技术、人工智能技术、数学建模技术、图像分析处理技术、计算机网络技术以及人类心理学等各个方面成果的融合,只有这样才能建立一个高效、快速、实用的图像检索系统。
参考文献
[1] 周文昭.基于内容的图像检索系统的最新进展.计算机工程与应用,2002(26):112-115.
[2] 谢毓湘.基于内容的图像检索技术研究.计算机工程与应用,2002(01):37-38.