潜在语义索引技术在知识产权专家库中的研究与应用

被引量 : 0次 | 上传用户:qiujunzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
潜在语义索引技术(LSI)是第三代搜索引擎的热点技术,是一种个性化的检索方法。第一代搜索引擎采用基于布尔逻辑的关键字检索技术,第二代在前者的基础上通过各种方法提高了查准率,而第三代搜索引擎则以实用性与易用性为目标,它运用了DeepWeb、人工智能、语义分析等前沿领域技术。目前,主流的搜索技术仍然采用基于布尔逻辑的第一代技术,它必需用户提供准确的关键字以供检索;而数据信息量的增加以及自然语言的灵活性与歧义性,使得传统的搜索方法越来越无法胜任用户的需求。作为替代者,个性化的搜索技术越来越引起广泛的重视与研究。近年来,苏州市涉及知识产权的案件和纠纷迅速增加,建立苏州地区知识产权专家库可以使市知识产权局能深入了解并掌握本地区各行业专家最新的第一手资料。但是面对本地区复杂繁多的行业、不同层面的专家及其研究领域,以及关键内容的各种不同方式的自然语言描述,传统的搜索引擎难以达到快速准确搜索的要求。在这种背景下,本文设计将LSI检索应用于苏州市知识产权专家库系统。根据调查,目前尚未有应用LSI检索的专家数据库的报道。本文将LSI技术应用于苏州市知识产权专家库检索系统中进行探索性研究,并根据专家库的特点和实际应用情况对相关技术和算法进行了研究和改进。具体包括以下几点:1、研究已有信息检索模型并总结优劣;同时在研究分析已有LSI技术的前提下,根据专家库的应用范围与特点,对相关技术进行了改进工作。2、阐述了一种基于LSI的专家库检索方法,运用基于层次化特征的快速聚类方法实现了基于LSI的专家信息快速检索。3、经过前期调研和大量工作基础上,实现了知识产权专家库原型系统,并在我局原始专家信息数据库上对系统的查准率、命中率等相关性能进行评价。
其他文献
山西通过对山西省农村中小企业的实证研究,旨在通过分析农村中小企业在融资过程中呈现出来融资行为及渠道选择,从政府、社会、企业自身提出相应地改进措施,以期有助于农村中
本研究从内隐社会认知的角度,采用心理学的实验方法,研究了大学生的广告性别刻板印象及其可塑性。本研究分为三个实验研究:实验一旨在探讨广告外显性别刻板印象的存在性。通
针对传统模型无法对网络流量异常进行准确识别和检测的问题,提出一种基于时间序列分析的网络流量异常检测模型.首先提取网络流量的原始数据,并对原始数据进行小波阈值去噪处
在低水平测氚中,分别从闪烁液、计数区间、有机相(闪烁液)与水相(试样)的体积比和计数时间的影响因素考虑,对测量条件做出选择,从而达到降低液闪谱仪的探测下限和提高仪器的
利用超低本底液闪计数器Quantulus 1220进行了一系列有关水中3H测量实验条件和方法的研究,归纳总结出提高水中3H测量准确性的条件和方法,并在所得到结论的基础上对衡阳地区的
课业负担一直是全社会所关注的热点问题。虽然国家连续发文下达减负令,然而对这一问题的解决效果并不理想。为了更好的解决这一问题,在新一轮“减负”运动开展的过程中,有必
文章通过概述知识链接的概念和内涵,阐述了知识链接的产生背景、作用和功能。在综述近年来知识链接研究现状基础上,提出了知识链接的发展趋向。目前知识链接研究与实践主要集
<正> 三十年前,中国革命确实还处于敌强我弱的局面下,可是,毛泽东同志就以高度的马克思列宁主义的科学分析和革命乐观主义精神,看出"星星之火,可以
随着医疗卫生事业的不断发展,医院所面临的风险越来越大,医疗风险基金起到了越来越重要的作用,因医疗风险基金来源的单一性,使医务人员的风险责任淡漠、医院的医疗赔偿被动和
随着人本理念的确立和员工关系理论的发展,雇主品牌在国际上逐渐被理论界和企业所重视。而在我国,大多数企业对雇主品牌的认识还处在相当初级的阶段,雇主品牌战略及其实施在