【摘 要】
:
如今社会正步入一个大数据时代,随着互联网行业的快速发展,各行各业直接或间接地都在享受着大数据所带来的便利,这是科技创新带来的结果,更是人类不断追求进步的结晶。在这个
论文部分内容阅读
如今社会正步入一个大数据时代,随着互联网行业的快速发展,各行各业直接或间接地都在享受着大数据所带来的便利,这是科技创新带来的结果,更是人类不断追求进步的结晶。在这个时代,人类对信息的迫切需求以及对人工智能领域的积极探索,使得自然语言处理领域得到了极快的发展,越来越多的应用都受到了用户的认可,如语音识别、文本翻译、信息检索与问答系统。自然语言处理又可称之为自然语言理解,它是人工智能领域一个重要的分支,而中文信息处理又是自然语言处理的一个重要分支,有着举足轻重的地位。中文信息处理当前在“字”、“词”两方面的研究已经较为成熟,但是在句子篇章方面还有待进一步的研究。其中主要研究的对象是复句,复句由多个分句构成,相比于单句,它结构更加复杂,所表示的含义也多种多样,所以对复句的研究有着重大的挑战同时也有着很高的研究意义。由于复句结构的复杂性,所以层次化汉语复句结构的分析,在理解汉语复句语义方面有着非常大的意义。在汉语复句层次结构识别方面,本文在论述了当前国内外研究成果和经验的基础上,重点描述了利用Bert神经网络方法以及注意力机制等策略对复句层次结构进行识别的方法。本文论述的主要内容包括以下部分:首先,描述了对复句进行精确分句划分的方法;通过依存句法获取复句的句法特征,然后通过模型训练得到句向量来获取句子的语义特征,此处使用Bert来替代Word2Vec,由于Word2Vec对于捕捉上下文信息来说有着巨大的弊端,丢失了太多信息,而Bert可以很好地解决这个问题。同时因为复句语义的多样性,特征提取中的词义消岐也是必不可少的手段。由于Bert较好的泛化能力,数据量相对来说不需要太过庞大,采用Bert结合CNN的方式进行对比实验,层次结构分析的准确率达到了 85.6%,基本达到了本次实验预期效果。反应出本文提出的基于Bert的深层语义特征提取方法运用于复句层次结构分析的有效性。
其他文献
目的通过研究短效GnRH激动剂(GnRH-a)长方案与拮抗剂方案这2种促排卵方案在体外受精-胚胎移植(IVF-ET)助孕中的成本及效果,从而选择一种更经济有效的促排卵方案。方法回顾性
《清实录》是清代官修编年体史籍,是研究清代历史的基本史料。清朝在位的12位皇帝有11位纂修有实录。《清实录》分别用满蒙汉三种文字书写,形成了不同文字书写的不同版本的各
宅急送的物流基地应该是一种规模非常大的物流结点,它的集约功能非常强,它的综合功能非常强,宅急送的物流基地可以分为全国性物流基地和区域性物流基地。
我国税收征管体制改革改变了长期以来的国地税分家管理模式,国地税合并,徐州市税务机关纳税人的办税成本降低,涉税业务办理更为便捷,有效的促进了税务机关纳税服务质量的提升
云南省第九次党代会提出了科学发展、和谐发展、跨越发展的战略发展思路,科学谋划了云南未来五年的发展蓝图,鼓舞人心,催人奋进。省委书记秦光荣指出:要树立高远、开放、包容
近年来,面对传统建筑所衍生的高污染、高能耗问题,绿色建筑因其自身绿色、环保和可持续的优点备受青睐。为顺应建筑的发展趋势,贯彻“绿色发展”和“可持续发展”的理念,我国从不同的层面制定了法律法规,颁布了诸多规划与政策以推广绿色建筑。为保障其高质、高量发展,还综合运用多元手段对其进行监管和激励。伴随绿色建筑推广的深入,相关规范性文件逐渐暴露其内在缺陷,对绿色建筑规模化发展的推动力不足。究其根源在于绿色建
近年来,中国在知识产权领域的发展备受世界瞩目,从目前已经公布的数据来看,2000年时,中国PCT国际专利申请量居世界第十六位,到2019年,中国PCT国际专利申请量已经跃居全球第一
达芬奇手术机器人系统作为一种新型微创系统具有安全,高效,局限性低的优势,而心脏外科是最能体现手术机器人价值的领域,克服了常规开放手术和腔镜手术技术的局限,实现了心脏
2020年"新冠"肺炎疫情极大的影响了学生的正常学习生活,在特殊时期应当发挥辅导员对班级管理的核心作用,抓住对大学生进行思想教育的时机,完善班级管理工作体系,培养大学生以
汉语复句研究,属于中文信息处理中的一小类。在中文信息处理这一领域中,对于字、词等方面研究较多。但在汉语复句研究一块,尤其是三分句复句,研究较少。复句,相比于简单句,所