语言学与统计方法结合建立汉语动词子类框架类型集

来源 :第九届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:acdd5230351
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动词子语类框架(subcategorization frame以下简称SCF)在语义角色标注等方面的研究中具有不可或缺的重要作用。在子语类框架信息的获取过程中,首先要建立标准完备的子语类框架类型集。目前英语研究已经建立了获得普遍共识的子语类框架类型集。而在中文方面,还没有标准的动词子类框架类型集。本文提出一种语言学知识与统计方法相结合的汉语动词子语类框架类型集的半自动获取方案。初步建立起了既符合统计结果又基本符合语言学理论的汉语动词子语类框架类型集。实验证明,加入语言学理论的子类框架类型集降低了对语料的依赖程度,比完全由分析语科产生的类型集更完备。
其他文献
本文介绍了一种半结构化的基于实例的机器翻译方法。该方法将双语翻译实例表示为半结构化的树串映射,一个树串映射由三部分组成:源语言分析树、目标语词串、及它们之间互译词
会议
结构化的句法信息在较高层次的自然语言处理研究中起着关键作用。不过哪些结构化的句法信息是有效的以及如何在具体研究中有效体现结构化的句法信息依然是悬而未决的问题。本
会议
自动分词是中文信息处理系统的基础,有着极其广泛的实际应用。为了了解自动分词当前实际应用中的情况,作者使用第三代智能分词系统3GWS对2006年3月《人民日报》的300个新闻文
会议
运用生物信息学方法分析了禾本科植物水稻、高粱、二穗短柄草、玉米中NBS-LRR型抗病基因的进化特征,发现NBS-LRR型抗病基因在染色体上分布不均等,且大部分都位于基因簇中.NBS
随着web2.0的发展,Blog(博客)以及其他注重用户体验的各种新技术可以让很多普通用户(草根用户)方便快捷的通过自己的博客、社区或论坛,发布自己的心情和感想,其中包括对某企
会议
“角色的生活不是仅仅出现在舞台上,在演员自己的生活中,你的周围发生任何一件事情,你都应该尝试着以角色的身份去接触,这样角色就永远伴随着你……”库里涅夫专家在下课之
本文认为,要构建高质量的健分词语料库亟需在现有的分词规范中着重补充以下三方面的内容:(1)命名实体(人名、地名、机构名)标注细则;(2)表义字串(数字、时间、日期、电子邮箱
会议
由于基于已切分语料的学习方法和体系的兴起,中文分词在本世纪的头几年取得了显著的突破。尤其是2003年国际中文分词评测活动Bakeoff开展以来。基于字标注的统计学习方法引起
会议
本文采用了目前汉语分词领域中一种优秀的分词方法-基于字的分词方法,通过实验的方式量化地探讨了在这一方法中不同的特征模板对于词表词和未登录词识别所起的作用。结果显示
工信部的最新数据显示,2011年上半年,全国进出口总额17037亿美元,同比增长25.8%;其中,出口8743亿美元,增长24%,增速比一季度回落2.5个百分点;进口8294亿美元,增长27.6%,增速