面向主题的标准文件检索系统的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:gv_coolway
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先在对传统信息检索的检索原理与实现技术进行分析的基础上,分析了传统信息检索的局限性和智能检索的技术特点与优势。认为基于关键词匹配的检索方法是导致其现有局限性的主要原因,提出面向主题的检索技术是解决问题的一种重要途径。面向主题的检索包括概念检索、基于内容的检索、主题簇性检索,并能实现面向主题的智能检索、智能导航等功能。 论文分析了标准文件的特征,结合自然语言在面向主题检索技术中的重要作用,通过大量主题词的提取、分析,将各概念节点组成有机的语义网络,揭示概念之间的多种关系。探索建立了标准文件检索系统语义网络知识库,实现了标准文件检索系统面向主题检索的基础。 本文针对标准文件的特征,采用了面向主题的概念语义网络的文本检索算法,依托概念网络建立主题概念树,利用主题概念树对用户的查询请求进行语义扩展,实现同义和语义蕴涵检索。相关度的计算模型考虑了词与词之间,句与句之间的语义激励。通过相关度在主题概念树上的传播模型,实现复合概念相关度的计算。 最后,对本系统做了总结和展望,指出系统需要进一步完善和继续研究、探索的方面。
其他文献
在我国,小麦是主要的食物,也是食品工业的主要原料,种植面积及产量仅次于玉米与水稻,居于第三。由于我国小麦的种植地区大部分分布在干旱、半干旱地区。因此,挖掘小麦抗旱新基因,选
本论文以本实验室分离培养的野生黄伞(Pholiota adiposa(Fr.)Quél.)为实验材料,着重研究了黄伞液体培养工艺和菌丝体多糖提取工艺。采用体外抗自由基实验、血清溶血素测定实验(体
虽然现在的计算机技术在内存和速度方面都有飞速的发展,但是人机接口技术的发展相对滞后。这阻碍了计算机技术在人们同常生活中的应用。语音识别技术的出现,可以有助于建立自然
随着无线通信新兴技术的不断涌现,人们对无线频谱资源的需求也在不断上升。而现有的静态频谱使用政策,导致可分配的频谱资源少之又少,频谱资源的供需问题愈发紧张。认知无线
随着无线通信用户的增多,频谱资源变得日益稀缺,但是数据显示,拥有频谱使用权的授权用户对于频谱的利用率却并不高。因此,近年来认知无线电技术成为频谱资源利用率的解决方案。认
对拖拉机使用中遇到的挂挡困难、低速挡行驶时底盘发响、制动时向右跑偏、转向沉重故障进行了分析,指出了故障产生的原因,对故障诊断排除方法进行了探讨.
低速无线个域网(LR-WPAN: LOW Rate-Wireless Personal Area Network)因其独特的优势和巨大的应用前景受到学术界和工业界的广泛关注。IEEE802.15.4标准被公认为是一种适用于W
日本龟蜡蚧(Ceroplastes japonicus Green)属昆虫纲(Insecta)半翅目(Hemiptera)蚧总科(Coccoidea)蚧科(Coccoidae)的蜡蚧属(CeroplastesGray),它分布广,寄主多。在山西省的中
随着移动通信与互联网的普及,移动业务尤其是数据业务呈现出迅猛的增长势头,业务种类日益丰富。目前存在的大部分移动应用平台由于自身体系结构的缺陷,无法迅速高效的把各种业务
西施舌人工育苗过程中,附着变态阶段常发生大量幼体变态延迟及死亡的现象,使附着变态成为制约大规模生产的瓶颈之一。本研究探讨了附着变态的影响因子及化学诱导技术,以期改进西