基于本体构建理论的数字档案资源库的构建

来源 :办公室业务 | 被引量 : 0次 | 上传用户:gisbird
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】将本体构建理论运用于档案管理信息系统的建设中,并利用Protege工具完成建模与分析处理,从而将档案管理中的一部分转化为抽象概念,以完成概念之间的关系构建。本文主要介绍了应用本体理论构建数字档案馆的建模流程,以实现信息检索的智能化与人性化。
  【关键词】本体论;数字档案;知识检索
  传统的数字档案馆是采用基于元数据的关键词检索方式,早已不能满足用户多元化的需求。因此,本文尝试建立一种基于本体论的数字档案馆知识检索模型。通过本体知识、分析理解、概念提取与匹配等方法,从而实现信息检索的智能化。
  一、本体论概述
  本体(Ontology)属于哲学方面的概念,从哲学的角度来说,它是对客观存在的一个系统的解释或说明,关注的是客观现实的抽象本质。1993年,Gruber对此进行了新的定义,认为“本体是概念模型的明确的规范说明”。后来,Borst在此基础上对本体理论进行了完善,认为它是指共享概念模型的形式化规范说明。Studer对此进行研究与总结后提出“本体是共享概念模型明确的形式化规范说明”。“概念模型、明确、形式化、共享”是这一概念中的4大特征,它们是在计算机人工智能方面有知识表达的意思。我们将本体理论运用到数字档案管理信息系统建设中,对档案资源进行描述,并统一数据采集模式,从而实现信息资源的共享与提取。数字档案馆管理系统的主要功能包括借阅管理、档案录入、档案检索、档案备份与恢复等。
  二、数字档案系统利用本体建模流程
  档案管理系统中的本体是档案范畴内的专有概念,用于表示某个专门领域范围内的全部知识。领域本体是专业性范畴,可详细描述出某个学科内的关键词条与这些词条间的关系。有时描述的内容还涉及到该学科内颇有影响力的理论成果。具体来说,档案领域本体就是针对查询功能的档案领域建模的结果。通过充分挖掘将与档案有关的所有查询操作均抽象为同一组概念。档案本体对现实活动中档案的解释,是基于概念结构与抽象空间两个方面的,属于一种系统化过程。创建本体的方法不是唯一的,但能保证本体构建的正确性与完整性。本体构建流程包括四步:确定需求分析、创建共享词库、表示本体、客观评价本体。
  本体中最基本的概念就是类,定义本体中的类实际上就是明确类之间的层次关系,并明确类的属性以及类之间的约束关系。对于概念层次的分析主要有3种方式:分别是自顶向下法、自底向上法、综合法。自顶向下法是指在某一领域中从最大的概念开始,逐步添加子类,从而将概念细化。自底向上法则相反,是从最小的类定义开始,逐步向上将这些相似的类组织在一起形成更大的概念。综合法是将上述两种方法结合起来运用的方法。不管采用何种方法,均是从定义类开始。比如,以档案本体为例,采用自顶向下的方法,其中,最基本的类有档案与档案信息两个。在检索档案信息时,用户可将题目、档案号、分类号、责任者、关键词等作为检索条件。因此,顶层概念就是OWL Thmg,中间层概念包括档案与档案信息,底层概念中档案对应的是档案类别,包括文学档案、历史档案、科技档案等;档案信息对应的是卷宗号、案卷编号、题名、文号、文种、密级、保管期限等信息。
  三、利用Protege构建档案领域本体
  根据目标客户的具体需求来建设档案管理信息,以提高档案管理的工作效率。Protege是基于面向对象的JAVA的一种开发工具,支持类、元类及属性的OKBC兼容。在利用该工具构建本体时共有4个步骤,包括需求分析、確定类与所属层次、明确属性,添加实例。在设计档案检索领域中的本体时,借助该工具生成OWL文件,达到检索目的。
  当需要输入实例时,必须先确定类与属性的结构。比如,要将一个有序的子类插入到已排好序的父类中,可选用数据结构算法描述其中的任何一种插入算法,包括直接插入、两路顺序插入、表插入等。若要添加实例,还需利用Individuals标签内的5个面板,涉及到的属性内容主要有类的思想、实例名称、性能复杂性等。下面,我们以直接插入为例进行阐述:Individual:直接插入排序算法。转化为具体文字描述:某个有序序列[1...,i-1],共有i-1个元素,若要插入r[i],那么,序列的元素个数就变为i个,新序列为r[...i]。在插入时必须注意存放序列的数组不准越界,可采用顺序查找算法,在r[0]的地方设立一个“监视哨”,任何插入操作均是从“i-1”向前挨个搜索,记录能在查找过程中顺序往后移动一个位置。简而言之,排序的过程需完成的插入操作有(n-1)次。将序列中的首个元素作为最简单的有序序列,并从第二个记录开始依次添加到该序列中,直到全部记录均被插入到序列当中。这里的序列是采用关键字进行排序的。
  四、结语
  随着社会的发展,档案数字化的进程进一步加快,数字化档案建设取得了一定的成效,但仍存在不少问题。因此,本文以本体构建论为基础,利用本体的思想与方法,对档案领域的知识进行组合与整合,并通过规范的形式化语言进行描述,以进一步提高数字档案管理效率。
  【参考文献】
  [1]贾艳平,吴永明.基于本体论的数字档案馆知识检索模型的研究[J].大众科技,2012,14(5):222-223.
  [2]周佳明.基于本体特征的档案系统模型构建[J].扬州教育学院学报,2015,33(2):51-54.
  [3]李海军.档案管理信息化之本体方法讨论[J].山西档案,2007,35(6):16-17.
其他文献
本文依据SOS反应原噬菌体诱导法的基本原理对同步进行抗诱和诱变变试验的方法做了多种研究,取得了满意的结果。
将Ti27Nb8Zr合金进行固溶时效处理,应用超声水浸聚焦法并结合纵波掠入射方法测量超声波在各个时效样品中的传播速度,基于声波在各向同性、均匀固体介质中的传播规律,推算时效
目的:观察疏血通与弥可保联合治疗糖尿病周围神经病变的临床疗效。方法:将96例患者随机分为疏血通联合弥可保组(联合用药组)与弥可保组,每组48例,观察两组患者临床疗效以及联合用
政府组织间的信息共享对于提高政府管理和服务水平具有重要意义,政府组织的信息共享能力决定了信息共享的效果.针对目前政府组织间信息共享能力评价的缺陷,设计了影响政府组
《大连理工大学学报》(即自然科学版)是由国家教育部主管、大连理工大学主办的自然科学综合性学术刊物(双月刊,国内外公开发行),主要报道大连理工大学(包括海内外校友)最新科研成果,并
运用文献研究法辅以计算机统计方法,对263首古方与自拟方进行分析,从而探讨中医治疗支气管哮喘的组方用药特点,为临床诊治哮喘及研发新药,提供文献参考资料。
蛋白质的亚细胞定位与其生物功能密切相关,蛋白质数据库急剧膨胀,迫切需要设计出功能强大的高吞吐量的算法来预测蛋白质的亚细胞位置.许多预测工具都是基于伪氨基酸组成构建
针对相邻交叉口在共有连线上均渠化左转短车道的现况,研究其时空资源的最优配置.通过分析短车道对进口道饱和流率的影响,建立以交叉口通行能力最大化与车均延误最小化为目标函数
以大鼠作为实验动物,于喂饲高脂饲料的同时加喂养荞麦粉,观察了荞麦对大鼠血清中脂质过氧化物(LPO)水平的影响。结果提示,与高脂造型组比,荞麦具有减轻食诱性血脂升高和抗脂
三方融资是证券公司营业部中开展的一项新型融资业务.本文在分析三方融资的特征、流程和风险的基础上,提出了规范和发展这项业务的思路.