与自然语言查询表述相关的词语分析

来源 :图书情报工作 | 被引量 : 0次 | 上传用户：A136C316

【摘要】

：

考察在信息检索过程中用户以自然语言表述的查询语句中的词语使用情况。以一个信息需求描述颗粒度不等的查询表述语料库为素材,辅以汉语通用语料作为对照,通过词频以及词语的

【作者】

：

熊文新

【机构】

：

北京外国语大学中国外语教育研究中心,

【出处】

：

图书情报工作

【发表日期】

：

2012年17期

【关键词】

：

查询语句检索项语料库词语分布信息检索目标文本通用语文本需求描述检索过程

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

考察在信息检索过程中用户以自然语言表述的查询语句中的词语使用情况。以一个信息需求描述颗粒度不等的查询表述语料库为素材,辅以汉语通用语料作为对照,通过词频以及词语的文本覆盖率等统计数据,按照是否需要在目标文本中直接或以其他形式出现,将查询表述语句中的词语区分为对汉语文本处理具有普遍意义的通用停用词、服务于信息检索表述用的专用停用词和与特定需求相关的信息内容词语。区分词语使用的不同性质,能为信息系统前端的自然语言查询处理增加一道剥离工序,防止将整个查询语句的分词结果全部作为检索项所造成的效率和准确率的退化。 Investigate the use of words in the query of the user in natural language during the process of information retrieval. A corpus of query expression corpus with different granularity is described by an information requirement, supplemented by the Chinese common corpus as a control. Through statistical data such as word frequency and textual coverage of the words and so on, according to whether the need exists in the target text directly or in other forms, The words in the query expression are divided into general stop words that have general meaning to the Chinese text processing, special stop words to serve the information retrieval expression and information content words related to the specific requirement. Differentiating the different nature of the use of words can add a stripping process to the natural language query processing in the front end of the information system to prevent the degradation of the efficiency and accuracy caused by all the word segmentation results of the entire query.

其他文献

饲料中霉菌毒素的危害及其预防

饲料中的霉毒素是一种具有雌激素生物活性的真菌毒素,主要是改变饲料的适口性,降低饲料的营养价值,影响动物繁殖机能,导致动物繁殖机能紊乱。霉菌毒素还具有免疫毒性、肝毒性

期刊

菌毒素免疫毒性机能紊乱霉菌素繁殖机能营养价值肝毒性动物繁殖玉米赤霉烯酮霉毒素

合成氨脱碳系统的节能改造

介绍了脱碳系统存在的问题,并采取了相应的改造措施,此次脱碳系统改造总投资约125万元,该项目年总效益为141万元,投资回收时间为10个多月,项目投产不到1年即可收回全部投资,

期刊

脱碳系统碳酸丙烯酯投资回收节能技术闪蒸槽尿素系统二氧化碳压缩机自动调节装置过滤机再生塔

牛SRAP-PCR反应体系的建立与优化

以牛的基因组DNA为材料,对影响牛SRAP-PCR扩增的各因素浓度进行了优化,建立了重复性好、稳定性高的SRAP-PCR反应体系。结果表明在30μL的SRAP反应体系中5种成分的最适浓度为:

期刊

SRAP反应体系聚合酶DNA标记技术碱基互补配对日本沼虾非特异性条带性状相关育种法

提高隔膜电解槽电流效率的措施

提高隔膜电解槽电流效率,可以降低电耗,对氯碱工业的可持续发展十分重要。本文详细介绍了提高隔膜法电解制烧碱的措施:提高精盐水质量,提高入槽精盐水温度,提高隔膜吸附质量

期刊

隔膜电解槽槽绝缘组装质量金属阳极停车次数氯碱企业槽电压离子膜电解槽解制阴阳极

“Technology for Adsorptive Separation of Normal C_5-C_6 Alkanes Developed by RIPP” Passed Technical

Recently the technology for adsorptive separation of normal C_5 and C_6 alkanes developed by RIPP has passed the technical appraisal organized by the Science an

期刊

alkaneszeoliteengageappraisalpassedorganizedmanufacturenaphthaadsorbent

Third Plenum Points

The communique issued after the Third Plenary Session of the 18th Central Committee of the Communist Party of China(CPC)on November12 was striking because it ra

期刊

strikingDirectorissuedthoughtsranksSydneysectorlivedraisedCommunist

性恶不分官民

十八大之后，中央纪检部门没少抓贪官。这属于行动。理念上或者说制度上，中央纪委也在狂飙突进，如创新反府倡廉监督体制机制。各路学者见仁见智。从另一角度看，这种创新根本而言体现的是一种平等。　　一些民众一直这样认知：法律是给老百姓定的。这话只说对了一半。法律是规范所有人的，包括官员和老百姓。国家为何要制定法律？根本而言是出于人性恶的考虑。若无法律规范，人性恶就会释放，国家就会乱，所有人都遭殃。但民众的这

期刊

纪检部门人性恶制定法律监督体制法律规范狂飙突进违反法律人人平等上大夫

说不完的话

妈妈：李冬梅　　孩子 3岁、10岁　　我最最亲爱的儿子们：　　你们好！　　除了在你们的婴儿期每天为你们记录吃奶、尿尿、拉粑粑的日记，我好像还没有专门为你们写过什么东西呢，突然要给你们写信还真不知从哪下笔呢。可是每天和你们在一起时我们总有说不完的话，看着你们俩争着给我讲学校里发生的事，，我是如此幸福。喜欢和你们在一起嬉戏打闹。　　还记得上个月我们仨在放学的路上追跑打闹的事吗？结果过于激烈，妈妈不小心

期刊

赵书记姑嫂城党支部书记谷春秸秆气化党员代表大会洪波村委会干部工程总投资党员队伍

广饶县:把服务群众作为鲜明主题

建设服务型基层党组织,对县一级来说,重心在农村,关键是让村级有满意服务。广饶县按照“农村群众有什么需求就满足什么需求,最盼望什么服务就提供什么服务”的思路,着力构建

期刊

基层党组织限时办结制上级党组织两制服务职能要素资源服务中心解难题公益服务县行政

犬细小病毒性肠炎的诊治

2004年至2007年底,笔者共诊治犬细小病毒性肠炎148例,其中治愈96例,治愈率达64.9%,死亡52例,死亡率为35.1%,现将这几年诊断和治疗该病的经验叙述如下: From 2004 to the end

期刊

犬细小病毒急性肠道传染病腹泻物肠炎型心肌炎型临床症状可视黏膜被毛逆立主要病理变化犬病

与自然语言查询表述相关的词语分析

其他学术论文