论文部分内容阅读
分析了传统向量空间检索模型在网络信息检索中的不足,给出了基于文档结构的向量空间检索模型.该模型将文档在逻辑上分成N段,依据特征项对文档内容代表能力的不同,选择有限的最能代表逻辑段内容的特征项构造文本逻辑段的特征项向量与权值向量,并以此为基础计算文档与提问的匹配相似度值,从而决定匹配文档的检出与排列顺序.进行了两种模型算法时间复杂度的比较分析,讨论了改进模型的可能应用前景和存在问题.