论文部分内容阅读
随着云计算、物联网的发展,随之而来的便是IT产业的又一次颠覆性的技术变革,即大数据时代。大数据时代的来临揭示了网络上的数据特性呈海量而多样性,呈现的内容和形式也各种各样,数据量的剧增也使得现有的搜索技术面临着严峻的挑战。传统的自然语言处理技术较多的是基于语法层面上的处理,缺乏对知识的标识,处理和理解能力,即缺乏对信息资源的统一的语义描述,面对海量的用自然语言描述的网络数据,用户难以搜索到满意信息。本文提出了一种基于领域本体的语义合成技术研究,该模型以领域资源文档为数据源,引用数据源和领域本体之间的映射关系来表达数据文档的语义。论文提出了基于领域本体的语义合成模型,它由领域资源文档预处理、领域本体、语义相似度计算方法及语义推理等模块组成。本文对该模型进行了试验性的检索系统构建,通过对试验性系统的实验和结果分析来验证模型的有效性和可行性。基于领域本体的语义合成模型有助于提高了计算机处理信息的能力,该模型在检索系统应用中也改善了信息查询的召回率和查准率,提高了用户的满意度。