国家语言资源监测语料库介绍

来源 :中国中文信息学会成立二十七周年学术会议(CIPS2008) | 被引量 : 0次 | 上传用户:sabot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2005年,教育部语言文字信息管理司开始和国内若干高校陆续联合建设语言资源监测中心,其中包括与北京语言文化大学共建的平面媒体语言分中心、与中国传媒大学共建的有声媒体语言分中心、与华中师范大学共建的平面媒体语言分中心。这三个分中心分别建设了平面媒体动态流通语料库、有声媒体监测语料库、网络媒体监测语料库,它们共同构成国家语言资源监测语料库。语料库包括网页、纯文本,并采用中科院自动化所的自动分词工具做了自动分词。欢迎各界同仁共同开发、建设使用该语料库。
其他文献
本文就信息检索碰到的难题;文本蕴涵的一般及形式定义;为语义表达的多样性建模;文本蕴涵的类型;词汇层面的蕴涵的推理机制等问题进行了总结。
当今语言技术最严重的缺陷是没有有效方法去获取文本和言语中的真实内容,缺少基本上达到语言理解的系统。因此,计算语言学核心的、也是最宏伟的任务是实现深层语言理解,以便
本文介绍了文本蕴涵研究的应用目标;理论背景和文本蕴涵的定义;基于论元结构的技术路线;蕴涵知识的单元:蕴涵型式以及最终资源:蕴涵型式知识库等方面。
本文现就智能化中文平台势在必行;资源平台建设;中文远程教育平台以及标准化平台工程等方面做一总结介绍。
随着近年中国的国际地位迅速提升,汉语和中文作为国际语言的地位更形巩固。在这个信息年代,有效利用中文媒介提供及发放信息到各地,不仅是与大陆以外的所有华人区,更要有效地
会议
汉语缺乏句法标记,但不缺乏语义标记;直接分析无法直接写规则,但可从资源中学习规则:较小语言单位的语义结构组合成较大语言单位的语义结构的规律vs较小语言单位组合成较大语言单
局部振动是否可引起植物神经功能紊乱 ,目前国际上尚有争议。最近 ,我们对某金矿凿岩作业进行了局部振动卫生学的监测 ,对作业工人进行了心率变异性 (heart ratevariability,
甄别和句法结构相关的那部分语义,从而认识语义和句法之间的系统联系。句法结构很大程度上可以从动词的语义上引申出来;语义角色本身即带有句法信息;词汇语义与句法之间有多对
本文对块驱动的汉语句法语义研究动机、汉语块描述体系设计不同层次的汉语块标注库、块分析器开发进展、词汇关联性描述以及词汇概念网络开发进行了探讨。