与自然语言查洵表述相关的词语分析

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:applechenli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
考察在信息检索过程中用户以自然语言表述的查询语句中的词语使用情况。以一个信息需求描述颗粒度不等的查询表述语料库为素材,辅以汉语通用语料作为对照,通过词频以及词语的文本覆盖率等统计数据,按照是否需要在目标文本中直接或以其他形式出现,将查询表述语句中的词语区分为对汉语文本处理具有普遍意义的通用停用词、服务于信息检索表述用的专用停用词和与特定需求相关的信息内容词语。区分词语使用的不同性质,能为信息系统前端的自然语言查询处理增加一道剥离工序,防止将整个查询语句的分词结果全部作为检索项所造成的效率和准确率的退化、
其他文献
介绍SCOAP3资助联盟将高能物理学术论文转为开放出版的基本模式、内容范围和运行机制,指出它所代表的开放出版资助方式更适合数字网络时代,能更有效、更经济地保障知识获取,强调
生物制药产业的巨大经济效益以及对国家生物安全的战略意义,使其得到各国的高度重视。我国生物制药产业规模小,自主研发能力薄弱,急需提高产业竞争力。以提升产业竞争力为最终目
以美国Digium公司开发的一个开源软交换项目Asterisk为例,讨论高校图书馆开发VoIP语音呼叫系统的必要性和可行性。在此基础上对图书馆语音呼叫服务进行系统需求分析、系统的业
对7个典型的国外文献数据库所提供的个性化服务进行调研,着重阐述Web 2.0环境下个性化服务的5个发展特点。即支持用户在自己的空间内实现知识组织,提供开放机制实现服务的嵌
期刊
由文化部、广西壮族自治区人民政府主办,国家图书馆协办,广西壮族自治区文化厅承办的2012中国一东盟文化论坛将于9月11日在南宁开幕。8月22日,自治区文化厅举行新闻发布会介绍论
采用直接映射和同现映射相结合的方法,针对DDC23和CLC5的化学工业领域类目展开研究。将类目划分为两大类别五种类型,提出不同类型类目匹配时应遵循的基本规则;按照类目类型和
实现京津冀协同发展,是面向未来打造新的首都经济圈、推进区域发展体制机制创新的需要,是实现京津冀优势互补、促进环渤海经济区发展、带动北方腹地发展的需要,是一个重大国
电子政务服务整合是目前电子政务发展的趋势,也是电子政务领域的重要研究内容。现在已有一些研究者从不同角度对服务整合的概念、模型、实现方法等问题做了研究。而本文针对现
通过对国内96个大学图书馆博客网站的网络调查,从建站单位、建站时间、单位属性、博文数量及访问量、主题内容、建站平台等6个方面,对国内大学图书馆利用博客提供服务的现状
期刊
期刊