论文部分内容阅读
随着网络信息资源的急剧增长,人们越来越多地关注如何快速有效地从海量的网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用。搜索引擎技术解决了用户查询网络信息的困难,传统信息查询方式下,由于信息资源缺少统一的语义描述,用户难以查找到与需求相关的资源。如何根据信息资源所具有的领域知识,实现信息资源的语义查询,提高数字化信息资源的利用率,这些问题是信息查询领域所面临的挑战。在对Web信息查询现有问题进行剖析后,总结了基于语义Web的信息查询方案,描述了信息查询系统的设计思想和查询流程,并对系统模型的合理性进行了论证。另外,对其中所涉及的领域本体构建、信息资源收集、语义推理、查询结果排序和倒排文件索引等关键技术及解决方案进行了研究,针对现有的语义Web的查询实验系统在查询速度上的不足,引入了一种倒排文件分块组织方法,兼顾了文档编号序列和文档权值序列在查询系统性能中的不同作用,为综合优化系统性能提供了一个可操作的框架。最后,提出了一个减少缓存的改进算法,并在此基础上研究了分块组织策略对性能的影响。通过分析和研究表明,这一分块组织策略可以读取少量倒排表数据而得到查询结果,减少查询算法的执行时间和内存空间,总体上提高了查询系统的效率。