自动词法学习关键技术研究与实现

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:you3880066
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词法学习技术的主要任务是通过机器学习或是其它的一些计算方法,从语料中自动获取某一门语言的词法规则。这些词法规则主要包括单词在不同的语境中产生变化的规律,在自然语言处理系统中有很重要的意义,尤其是在词法处理中有着重要的运用。词法处理是指自然语言处理系统在进行句法分析之前,对句子进行的词汇级的处理,对于英语这类屈折形态变化的语言,词法处理主要任务是对变形单词进行分析,转换成原形单词和附加的词形特征属性。词法处理是自然语言处理中一个重要内容,是进行句法分析、语义分析的基础,在搜索引擎、文本分类、信息抽取、数字图书馆、机器翻译系统等中有广泛的应用。本文主要以英语为例对屈折形态语言的词法处理和词法学习进行了研究。 本文首先对国内外各种词法学习和词法处理技术进行调研,通过对各种词法学习技术的功能进行分析,并集成了双层词法处理系统和不同的词法学习技术模块,提出了一种集成式词法开发平台构建的方法,通过这种集成式词法开发平台可以从一个文本中学习出双层词法规则,从而方便地从这个平台上构建出各种屈折形态语言双层词法处理工具。该平台主要由三个部分组成:双层词法处理模块、词法学习模块和规则生成模块,分别在文章的第二章、第三、四章和第五章详细介绍。最后对集成式词法开发平台各个模块之间的接口存在的一些问题进行了分析。
其他文献
分析高校图书馆科研诚信保障体系构建的可行性,设计高校图书馆科研诚信保障体系"纵向贯通、横向协同、内合外联"的架构。探讨高校图书馆在高校科研诚信保障体系建设中的创新
MOOC正在引发大学传统学习形态的根本性改变。分析MOOC环境下用户的资源需求以及大学图书馆面临的问题及挑战,提出基于数据分析制定采购策略,建立以用户需求为导向的资源采购
综述图书馆联盟信息营销的理论成果与实践活动,结合4P和4C策略构建大学城图书馆联盟营销组合策略模型,并以FULINK为例,对其实施营销组合的策略和取得的效果进行分析,探讨大学
针对当前大学生科研训练中的学科服务需要,整合图书馆各项科研辅助服务,构建大学生科研训练中图书馆引导式服务的体系和流程,包括普及信息素养的申报阶段、搭建科研平台的过
期刊
在理性认识科学数据内涵、特点及科学数据管理流程的基础上,提出基于科学数据管理的图书馆数据服务体系,包括数据管理政策保障系统、数据资源建设系统、数据加工系统、数据存
本文通过对荣华二采区10
在我国高校图书馆数字资源采购联盟(DRAA)签署的采购协议中,抽样61个文档进行文本内容分析,建议采购协议的条款进行模板化或谈判之前拟定好模板化的使用许可协议,以最大限度
随着Internet的快速发展,网络服务呈现出细分和个性化的趋势,运营商的关注焦点是以创新为主要特征的个性化服务和增值服务。本文研究的课题业务选择网关通过提供个性化的服务菜
期刊