海量规模中文网络信息检索评测语料库的设计与实现

来源 :中国中文信息学会成立二十七周年学术会议(CIPS2008) | 被引量 : 0次 | 上传用户:jeffery2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网信息的爆炸性增长使得每个人都可能访问到海量的网络信息,从互联网宝库中高效率的获取最有用的知识因而成为了当今时代最重要的技能之一。互联网搜索引擎的发展使得普通人也能够极为方便的高效获取知识,而网络信息检索技术也成为了计算机应用领域最热门的研究方向之一。信息检索是一门重视实证的学科,每一种新技术的提出,都必须同时设计相对应的评价方式对技术的性能加以验证,因此信息检索标准评测语料库一直对于信息检索技术的发展起到了巨大的推动作用。本报告将回顾网络信息检索评测语料库的发展历史与现状、总结相关语料库发展中的经验和教训,并分析当前中文网络信息检索评测语料库设计和实现中面临的种种问题,报告将介绍SogouT语料库为解决这些问题而独特设计的构建方法、语料库的主要特性和获取方式,同时也会介绍“搜索仪”网络检索在线评测平台的设计思路和使用方法。
其他文献
汉语缺乏句法标记,但不缺乏语义标记;直接分析无法直接写规则,但可从资源中学习规则:较小语言单位的语义结构组合成较大语言单位的语义结构的规律vs较小语言单位组合成较大语言单
局部振动是否可引起植物神经功能紊乱 ,目前国际上尚有争议。最近 ,我们对某金矿凿岩作业进行了局部振动卫生学的监测 ,对作业工人进行了心率变异性 (heart ratevariability,
甄别和句法结构相关的那部分语义,从而认识语义和句法之间的系统联系。句法结构很大程度上可以从动词的语义上引申出来;语义角色本身即带有句法信息;词汇语义与句法之间有多对
本文对块驱动的汉语句法语义研究动机、汉语块描述体系设计不同层次的汉语块标注库、块分析器开发进展、词汇关联性描述以及词汇概念网络开发进行了探讨。
2005年,教育部语言文字信息管理司开始和国内若干高校陆续联合建设语言资源监测中心,其中包括与北京语言文化大学共建的平面媒体语言分中心、与中国传媒大学共建的有声媒体语
会议
本文就继续构建汉语框架语义网(CFN);开展现代汉语句子的语义角色自动标注以及研究在标注语料库基础之上汉语分析模型进行了探讨。
中科院新疆生态与地理研究所荒漠与绿洲生态国家重点实验室科研人员发现,气候变暖加剧了西北高山区冰川的消融,改变了水资源的构成,加剧了干旱区水资源的不确定性,水资源管理亟待
当前,国际人工智能、计算机科学和认知科学研究的一个中心课题就是与智能计算机研制有关的语言学问题。由于自然语言的语义模糊性大、歧义性复杂、最不成体系且最难以处理,因
会议
自我转型,还是寻求合作? 本文就校企合作三要素、高校怎样与企业合作及其企业合作的态度和模式进行了探讨。