论文部分内容阅读
企业信息化建设,正经历着由开发一个个相互独立子系统向以数据中心为核心的一体化平台的方向转变。企业数据中心的建立不仅满足了企业各应用系统的需求,而且解决了信息冗余、信息孤岛等问题.但随着企业历史数据和新数据的与日俱增,各种数据在为企业用户提供大量信息的同时,也增加了用户深度检索的难度。
企业知识库是描述和定义企业特定概念和概念之间的关系,提取基本术语,构建一组领域内与实体相关的词汇、定义、公理等集合,形成明确、形式化的规范说明.企业知识库的构建同步企业数据中心的形成,这为企业今后决策、智能检索都提供了强有力的支持.本文在分析数据中心的检索现状及预测今后检索需求情况下,提出了结合企业数据中心现有的目录关键词检索方式的智能信息检索模型.在详细描述了智能信息检索的设计思想和检索流程后,深入分析研究了企业知识库建立、语义推理、信息抽取这几个和智能搜索紧密相关的技术和相关算法.同时也深入探讨了分词、全文检索这两个支撑整个智能模型设计的关键技术.在整个文章中贯穿Tim Berners-Lee倡导的语义万维网概念,在资源之间建立机器可处理的各类语义联系.最后,给出整个系统设计思路,利用Lucene开源框架、Jena2.1和proégé2000工具对系统各接口进行设计,最后简单分析实验结果。