基于隐马尔可夫模型的中文词义消歧方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:kingorbread
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言中,一词多义的现象普遍存在,这使得机器对自然语言的处理变得十分困难,词义消歧是自然语言处理领域的一个关键问题。词义消歧的目标就是让机器能够在特定的上下文中自动判断歧义词的准确含义。在信息检索、主题跟踪、文本分类和机器翻译等方面,都有着十分重要的作用。到目前为止,词义消歧一直是困扰计算语言研究者的复杂问题。本文的主要研究内容是基于机器学习理论的有监督词义消歧方法,这种方法是目前词义消歧领域中的主流研究方法。该方法有着很强的扩展性和灵活性,能够应对不同语言并适应语言的发展。本文的主要研究内容有以下几个部分:首先,对词义消歧领域的发展情况进行了阐述,并列举了有代表性的方法。对消歧模型的权威评价体系进行了介绍,并阐述了影响词义消歧研究的仍未解决的问题。其次,介绍了消歧过程中所用到的语料及词典,对语料的解析过程、语料的性能、消歧特征的提取和选择进行了研究。为了判定分类器结果的正确性,研究了两种映射方法。在分析了同义词词林中对语义分类方式后,选择两层语义代码作为消歧特征,以此来优化隐马尔可夫模型,构建了基于隐马尔可夫模型的消歧分类器。最后,将词义消歧看作隐马尔可夫模型的解码问题,提出了基于维特比算法的消歧算法,并详细讲解了算法的计算过程。做了两组实验来评价本文所提出的方法。
其他文献
一汽奥迪的A6L大家都再清楚不过了,在中高级行政轿车中,它的大名无人不知无人不晓。那么进口奥迪S6又有多少人知晓呢,想必除了奥迪的忠实粉丝,又或者对性能充满了无限渴望的人以
随着经济的发展,汽车成为人们出行不可或缺的交通工具,汽车挂件也成为时代发展的新潮流,受到越来越多有车人士的关注。小巧精致的汽车挂件寄托了祝福与期待,营造出新潮、时尚
电力企业大都形成于计划经济体制下,小而分散,其中一部分是事业性质、企业化管理,依附于政府,成本管理基础相对较差。近年来各地都在积极探索公司制改革。本文重点阐述电力企业建
目的探讨老年人在重大节日及冬、春寒冷期间急诊发病因素和规律,着重总结一线急诊救治要采取的方式、方法和注意事项。方法报告冬,春及重大节日期间急诊抢救14例老年心血管疾病
利用图像处理技术对1991年、1995年、2001年的TM影像数据进行处理以提取洪湖市湿地类型,并通过GIS空间分析计算洪湖市各类型湿地变化的紧凑性指数和熵.结果表明各类湿地均有不同程度的变化,湖泊、河流的面积减小,并且湖泊的紧凑性指数较大,反映出湖泊减少的速率很快.3年间各类型湿地的平均熵值有所减小,这说明洪湖市湿地正朝着集中化的分布方式发展,这是人为干预湿地所造成的结果.
党的十六届五中全会和今年中央1号文件作出了建设社会主义新农村的重大部署,而建设社会主义新农村的首要任务是“生产发展”,推进现代农业建设,强化产业支撑。因此,做大做强经济
随着经济的发展,人们不再仅仅留恋城市风光,更多的游客走向乡村,去品味乡村文化,感受乡村生活。于是乡村旅游便发展成为一项新型的旅游方式。针对国内游客,各地的乡村旅游部
该文以中国风的设计为启示,分析月饼包装设计如何更好地使用各种中国风元素,从而更好地体现出中华民族的传统特色。该文通过几个设计实例,论述了几种中国风元素的搭配方法,提