基于语义的现代汉语介词理解研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:slie726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代汉语介词(以下简称为介词)是现代汉语语法词类中的一个重要类别,没有实在的词汇意义,但是介词却是汉语语句中重要的语义信息标记,对汉语的词义消歧、语义分析等工作提供帮助,在汉语语义理解中有着举足轻重的作用。   基于语义的介词理解研究主要目的是解决介词相关主题的语义理解问题。论文以介词为研究对象、以概念知识树知识表示体系为理论基础,从介词知识库、介词语义模型、介词知识树和介词自动语义分析方面展开了深入研究,主要研究工作和创新点包括:   [1]概念知识树知识表示体系的进一步探讨   概念知识树知识表示体系是一种基于概念的知识表达体系。本文在已有研究成果的基础上,对概念知识树知识表示体系的知识库内容做了进一步的研究。   [2]介词知识库的建设   论文在借鉴汉语语言学介词研究成果的基础上,充分考虑了面向语义信息处理的特点,并以真实语料为对象,建立了一个专用于介词信息处理的知识库,它包括介词概念库和介词语料库。其中介词概念库包括了77个介词,199个介词概念;介词语料库包括了5637个带有介词的句子,7867个介词短语,6917个介词短语修饰对象。   [3]面向汉语语义理解的介词句法语义描述   通过对大量介词的归纳分析,论文总结了介词所介引的语义角色,共分为4个层级6个大类17个小类。以介词介引的语义角色为标准,确定了介词概念,并对介词语料库中的句子以面向汉语语义理解为目的从句法语义两个层面进行了详细描述。   [4]介词知识表示体系的建立   介词知识表示体系包括了介词语义模型和介词知识树。介词语义模型包括了介词概念本身的语义模型、介词短语的语义模型和介词短语及其修饰对象的语义模型。论文使用蕴含的语义逻辑来表示介词概念本身的语义模型,使用属性、关系和行为这三要素来丰富介词概念本身的内涵;使用语义约束的复合概念来表示介词短语,约束概念是介词概念介引的对象成分,核心概念是介词概念;使用修饰谓词性的语义状态复合概念和修饰体词性的语义约束复合概念来分别表示介词短语及其介词修饰对象所组成的两种不同复合概念:其中,语义状态类型中介词短语修饰对象是谓词概念,介词短语是谓词概念的状态概念;语义约束类型中介词短语修饰对象是核心概念,介词短语是约束概念。在对介词概念的语义模型以及介词介引的语义角色进行研究的基础上,建立了介词概念分类知识树以表示介词的句法语义知识。同时,还建立了介词短语动词修饰对象知识树和介词介引对象的时空知识树来存储与介词相关的知识。   [5]介词自动语义分析方法的设计   介词的语义理解内容包括介词介引语义角色的自动标注、介词短语的及其修饰对象的自动识别。针对这些问题,论文分别采用归纳逻辑程序设计和条件随机场进行处理。归纳逻辑程序设计充分利用了背景知识,可以使用介词概念库、介词语料库、介词概念分类知识树、介词相关时空知识树等,为规则的形成提供了充分的背景知识;条件随机场是一个序列标记算法,它充分利用了上下文相关的信息。实验结果证明这两种方法是有效的。
其他文献
无线自组织网络是由无线移动节点自组织而成的无固定基础设施的多跳无线网络。基于信任评估的信任管理系统可以通过对特定节点的监控识别恶意节点,尤其是内部攻击节点,将之驱出
学位
基于句法的统计机器翻译近年来逐渐成为统计机器翻译的研究热点.基于句法的模型有助于解决基于短语的模型所面临的主要问题,如短语层次上的重排序,泛化能力弱,以及要求短语连
定位技术是无线传感器网络的关键技术之一。基于射频(Radio Frequency, RF)信号的定位技术由于其仅利用节点自身的RF信号就能实现定位、无需额外硬件支持等特点而被广泛使用
随着 Web应用软件用户数量的急剧增长和业务规模的不断扩大,如何保证 Web应用软件的稳定性与可靠性成为人们关注的重要问题。Web性能测试是保证Web应用软件稳定性与可靠性的
信息技术的发展,使企业的全球化竞争日趋激烈,销售系统设计的目的是帮助企业进行更好的客户产品的销售管理,使企业建立弹性化和灵活性的业务流程,提高工作效率,减少人工操作中
本文首先概要地介绍了汽车电子领域的焦点——CAN/LIN总线技术,并结合基于重型卡车的CAN/LIN总线整车仪表控制系统的研发工作,从其机理、总体结构的研究到软硬件的开发设计、
随着Lntcrnct技术的迅猛发展,对人机之间,尤其是机器与机器之间的交互需求越来越多。具有松耦合性,自我描述以及XML文档驱动等特征的Web服务技术作为一种新型的分布式计算模
学位
网格是继Internet后的新一代信息基础设施,是新一代软件基础支撑平台。网格环境开放、动态、多变,其用户多样,用户需求多样且不断变化。面对网格新形势,研究如何构造可随网格环境
广告检测与识别技术是指利用计算机对广播电视节目中出现的广告进行自动检测并识别。由于音频广告检测与识别和相应的视频处理相比,效率更高,因此本论文将重点关注音频广告检测
目前,中职学校学生就业难,这是众所周知的。在“双向选择”“自主择业”过程中,既有成功的喜悦,也有无可奈何的叹息。在这方面,无奈和叹息的多半是中职毕业生。对此问题,教育专家提