基于领域本体的语义扩展检索算法的研究与应用

来源 :山东师范大学 | 被引量 : 3次 | 上传用户:cookie2189
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
I随着信息爆炸时代的来临,根据关键字进行搜索的查询技术无法满足用户快速获取信息和知识的需求。而信息化技术的深入发展与应用使得利用语义和知识进行信息搜索成为一种可能和必需。本体学习和本体技术可以挖掘文本信息中隐含的知识并对其进行加工和重用,面对结构各异、大量的文本数据,梳理领域知识规律并设计抽取算法,是困难的但是极具意义。在信息检索中融入知识和语义,让计算机具有一定语义理解能力和领域知识,可以更好地提高检索效率和用户满意度。本文提出一个基于人工智能算法的领域本体学习方法以及在此基础上的语义检索框架,并对这一框架的设计实施以及相关算法的智能化和创新性问题进行了讨论和研究。在阅读大量相关文献的基础以及领域专家参与下,总结出不同的领域知识在其文献载体中的表现方式不一样的规律,根据酶的领域知识特性,寻找易于实现合乎规律高效的方法。通过反复实践探索如何运用知识在信息检索中充分表达检索意图来提高信息检索效率和满意度。本文首先提出一种基于统计学的本体学习方法。通过与综合语料库的对比来定义领域术语的相关性。然后根据酶的领域知识特性,总结出某一种酶的领域知识存在于一定范围的相关领域语料中,而在整个领域语料库中均匀出现的术语是领域术语的谓词关系,从而提出领域确定性的定义。通过将两者结合来抽取领域术语,然后再抽取该术语的关系,并对提取结果进行语义过滤,提高本体学习的正确性,改善领域本体的构建效率。再运用人工蜂群算法对领域语料文本空间搜索来获得术语及关系。为避免跟随蜂选择较优蜜源的方式过于贪婪,使算法多样性不足,在跟随蜂和引领蜂的搜索中加入方向性搜索信息,设计均匀选择算子,通过与多目标优化问题适应度的配合,扩大搜索区域,避免陷入局部最优,使算法具有导向性。在构建的领域本体的基础上,探讨并初步实现了一个基于语义扩展的全文检索框架,将语义与全文检索有机结合起来,本体学习,构建领域本体,利用语义进行全文检索,并对结果进行评价,将该结果反馈于本体学习以及蜂群算法的参数设置中,形成一个高效的智能检索框架。最后对该智能语义检索框架的各部分,本体学习,检索效率以及性能进行测试和分析。本文创新性在于:总结领域语料库中酶学领域知识中术语中心词的概念在整个领域语料中只存在较少文本中,而领域知识中普遍存在的通用关系在语料库中是均匀分布的。根据领域知识规律设计领域确定度作为抽取的标准,并加入权重和阈值;运用蜂群算法在语料抽取概念的过程中指定侦查蜂的初始行为并加入均匀选择算子,加快迭代速度,保证解的多样性;在全文搜索中,将文本中含有的本体元素计算权重作为检索排序的一个重要标准,提出语义相关度的计算方法对语义扩展进行规范度量,从而使得到结果更接近用户的检索意图。本研究的意义在于将智能语义检索框架进行了应用,使信息检索系统具有一定的学习能力,并将学习所得的相关领域术语概念及关系,进行层次化的结构规范,以构建对领域知识的理解;又能在搜索信息时,利用构建的领域本体获得知识,将语义用于检索。最后通过评价检索效果,再对本体学习及蜂群算法的相关参数进行调整,改善学习和检索能力。
其他文献
配音行业属于国家监督和管理下的,具备意识形态的特殊属性行业,随着改革开放的发展,党和政府鼓励新兴的文艺行业不断发展,以扩大自身的影响力,实现文化强国梦。而如今配音作
通过建立草鱼肠道炎症模型,为经济鱼类炎症性肠病发病机理研究及药物筛选提供实验平台。于水温28℃条件下,从草鱼肛门插管注入0.25 mL浓度为2.5%的三硝基苯磺酸(TNBS)50%乙醇
在三维尺寸测量中,常用的数字光处理技术(Digital Light Processing,DLP)难以投射出高空间分辨率、连续的正弦光栅条纹,刷新速率也受限;激光干涉原理产生的条纹对比度不理想,
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
当前,我国正在推进“数字城市”、“智慧城市”等重大地理空间信息工程项目,车载移动测量技术(VMMT)发挥了不可或缺的作用,其具有外业数据采集速度快、自动化程度高、运行成
极坐标格式算法是应用于聚束式 SAR成像处理的经典算法。基于极坐标格式算法 ,研究了高分辨率星载聚束式 SAR的成像处理及相关问题 ,分析了非平面运动、运动测量误差对成像质
目的探讨反式抵钉座法吻合方式在腹腔镜下行全胃切除术后的应用效果。方法将60例接受腹腔镜下行全胃切除术患者随机分为反式组和经口组,反式组患者(26例)采用反式抵钉座法吻合,经