基于多特征融合的混合神经网络模型讽刺语用判别

来源 :第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD | 被引量 : 0次 | 上传用户:21stsun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在社交媒体中,存在大量的反讽和讽刺等语言现象,这些语言现象往往表征了一定的情感倾向性。然而这些特殊的语言现象所表达的语义倾向性,通常与其浅层字面含义相去甚远,因此加大了社交媒体中文本情感分析的难度。鉴于此,本文主要研究中文社交媒体中的讽刺语用识别任务,构建了一个覆盖反讽、讽刺两种语言现象的语料库,基于此挖掘反讽和讽刺的语言特点。本文通过对比一些有效领域特征,验证了在反讽和讽刺文本的识别中,其结构和语义等深层语义特征的重要性。基于此,提出了一种有效的多特征融合的混合神经网络判别模型,融合了卷积神经网络与LSTM序列神经网络模型,通过深层模型学习深层语义特征和深层结构特征,该模型获得了较好的识别精度,优于传统的单一的神经网络模型和BOW(Bag-of-Words)模型。
其他文献
  本文尝试从文本语义离散度的角度去提升自动作文评分的效果,提出了两种文本语义离散度的表示方法,并给出了数学化的计算公式.基于现有的LDA模型、段落向量、词向量等具体方
会议
  口语语料库的建设是口语研究的基础工作,本文选择具有代表性的交谈式谈话节目《锵锵三人行》和对谈式谈话节目《鲁豫有约》作为语料,建立了一个小型的谈话节目语料库,并构建
会议
  随着互联网应用的快速发展,网络用语的使用越来越普遍,网络新词层出不穷。网络文本中大量的网络用语,对基于自然语言处理的情感分析、产品推荐、自助问答系统等应用带来了一
  语义知识资源蕴含了深刻的语言学理论,是语言学知识和语言工程的重要接口。本文以形容词句法语义词典为研究对象,探索对语义知识资源自动扩展的方法。本文的目标是利用大规
会议
  分类器模型是目前识别因果关系的主要模型,该方法存在的问题是只考虑两个事件之间的关系,没有考虑同一文档中其它关联事件所包含的信息,识别结果往往存在逻辑矛盾.本文提出
  统计机器翻译对时间、数字、量词的泛化能力较弱,为了提高汉维机器翻译系统对时间、数字和量词短语的翻译性能,本文利用双语语料库挖掘并提取汉语时间、数字、量词表达与翻
  为了同时挖掘商品口碑数据中所谈论的对象、对象的某个方面以及评论者对这个方面的观点,用于指导消费者的消费和生产厂家对商品的改进,本文面向口碑数据提出一个无监督对象
  名词短语识别在句法分析中有着重要的作用,而英汉机器翻译的瓶颈之一就是名词短语的歧义消解问题.研究英语功能名词短语的自动识别,则将名词短语的结构消歧问题转化成名词
会议
韵律边界对言语表达的自然度和可理解度有着重要作用.韵律建模也是语音合成、语音理解中的重要方面.本文从相邻声调的相互作用角度出发,提出基于深度神经网络(DNN)及声调核声
本文以联接理论、事件结构理论为指导,进行词汇语义类、语义角色、句法成分对应关系的研究.选择人教社中小学语文课文语料,标注语义角色、句法成分及中心词的词汇语义类.在标