论文部分内容阅读
目前信息检索的正确率不太高,原因之一是用现有的检索模型难以表示完整的用户查询意图,而用户在查询中大量使用了复合结构。通过实例探索了汉语NN型复合结构基于概念图的语义关系标引,发现复合结构的关联语义关系可以通过子成分的上下文求解。这些上下文通过网络进行识别抽取,并借助《同义词词林》进行泛化以解决数据稀疏性问题。复合结构内部的语义关系用向量来表示,向量的每一维代表了能表示复合结构语义关系的一个上下文。实验表明,提出的方法取得了较好的结果。