论文部分内容阅读
随着数字资源的急剧增加,数字信息量越来越大,同时在激增数据背后,还隐藏着许多重要信息。这种情况下,如何保证用户能够有效的利用这些信息,一个有效的途径就是在现有信息检索系统的基础上探索新的方法和技术,并把这些方法和技术尽快应用到信息检索系统中。信息可视化技术在信息检索中的应用,为解决该问题提供了新思路、方法和技术。国外学者研究开发了多个信息检索可视化原型系统,其中绝大多数系统是对检索结果的可视化。除了信息可视化技术自身存在的目前还无法克服的一些问题外,这些系统还基于一个假设,即用户能够较好的表达其检索需求。实际情况是,大多数用户的信息需求是模糊的,无法准确的表达出来,他们在利用这些系统时就会遇到许多困难。基于概念空间的信息检索为用户描述、表达其检索需求提供方便。目前研究构建的概念空间主要是一般意义上的概念空间,即具有严格体系结构、概念含义限定严格以及概念之间关系层次清晰等,如叙词表、领域本体。由于它们在构建、使用过程中存在的问题,在信息检索领域应用的效果并不理想。鉴于这些情况,本文试图分析研究非一般意义上的概念空间,即以对象内能够描述对象内容的词为概念,通过词共现方式构建的概念空间,研究它能否在一定程度上替代一般意义上的概念空间,替代效果如何等,并以此为基础研究、构建信息检索可视化系统。
本论文主要的研究工作和创新包括以下方面:
(1)提出并实现了一个基于词共现的2维可视化概念空间动态构建模型。
(2)通过研究和原型系统测试、评价,证明基于词共现所构建的自然语词概念空间是可行的。在合适的阈值范围内,该类概念空间中所呈现的概念有一半以上属于一般意义上概念空间中的概念,同时共词关系可以在一定程度上替代一般意义上概念空间中的语义关系。
(3)基于概念空间的文本信息检索可视化系统为用户提供了概念空间的交互功能,通过与概念空间的动态交互,帮助用户理解和明晰其检索需求,有助于用户有效的描述、表达其信息需求。
(4)提出并实现了基于概念空间的信息检索可视化,实现了小规模数据集实时信息检索可视化,在信息检索过程可视化方面进行了初步探索。
(5)构建并实现了基于概念空间的信息检索可视化原型系统。
本论文共包括图36幅、表11幅、附录1个。