面向用户评论的观点目标和观点词协同抽取技术

来源 :桂林电子科技大学 | 被引量 : 2次 | 上传用户:huazi8527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络技术的快速发展和普及,对人类的生活模式产生了巨大的影响。目前在线购物已经成为人们的主要购物模式之一,用户评论对商品/服务提供商和其他潜在用户具有重要的参考价值。然而,用户评论的海量性使得用户难以快速地检索到期望的信息。因此,对用户评论进行自动化和智能化的分析处理显得极其重要。观点目标和观点词是用户评论中两个核心的成分,前者描述了用户对什么对象发表评价,后者表达了用户对该对象持有什么样的态度,这两者承载了大部分的用户观点信息。因此,从文本中自动抽取观点词和观点目标是进行评论分析和智能应用的一项基础工作。本文围绕观点词和观点目标的系统抽取展开研究,主要工作包括:(1)在已有的工作中,有监督的观点对抽取方法能够达到较好的抽取效果。然而,这类方法依赖于高质量的训练样本,而样本标注是一个耗时费力易错的过程。我们提出一种利用众包计算从用户评论中迭代式获取高质量观点词对的方法。首先,通过EM算法评估工作者的可靠性;然后,基于工作者的可靠性进行任务分发;最后,结合工作者可靠性和返回结果中标注词对的依赖信息产生最终的观点词对。在此过程的每次迭代中,利用生成的结果重新评估工作者的可靠性,能够在不增加成本的基础上保证结果的质量。实验结果表明,我们的方法在预算固定的情况下能够获取更多的观点词对。(2)基于带有注意力机制的观点依赖关系分析,进行观点词对抽取的方法。同一类商品下,观点词对中包含的观点目标和观点词通常有着很强的观点依赖关系,因此在观点词对的提取过程中,可以通过对评论句子中单词间的观点依赖关系进行分析来提取出观点词对。首先,构建出评论句子的依赖关系分析模型来获取到评论句子中每个单词之间的依赖关系信息,本文选择的基本模型是LSTM神经网络;然后,假设评论句子中所包含的观点词对中的一项是已知的,并将该已知项作为模型的注意力信息,使得模型能够从评论句子中有重点地提取出与该已知项具有强观点依赖关系的单词或词组,作为观点词对中的另一未知项;最后,将观点依赖关系得分最高的词对作为观点词对进行输出。接着研究工作进一步设计了一种复合模型,通过结合两种包含不同已知项信息的上述模型,来达到在不需要提前知道已知项的情况下实现观点词对的挖掘。
其他文献
随着社会经济和城市建设的快速发展,城市道路照明已成为城市文明和现代化程度的衡量标志。道路耗电控制作为智能技术应用的一个重要研究领域,在近年来社会发展中受到了广泛关
融媒时代的到来改变了传统的媒介生态,催生了一系列新媒体的发展,也给传统媒介发展带来挑战。作为传统媒介之一的广播也开始寻求自身的发展战略,努力打造核心品牌形象在竞争激烈的媒介大环境中争得一席之地。我国广播行业从建立之初就一直处于发展较慢的状态,广播行业整体的发展规模、品牌形象塑造、品牌建设理念和经营管理的发展战略相对落后。但是,交通广播这一频率却在融媒时代压力下冲出重围,快速发展,作为广播行业的领头
<正> 氯代正丁烷是重要的有机化工原料,用于制备月桂酸二丁基铝;在医药工业中用于制备动物驱虫剂、保泰松;在分析工作中做为丁基化试剂。氯代正丁烷的合成方法有5种,即氯化亚
介绍了环氧氯丙烷的生产方法,分析了国内外环氧氯丙烷的生产消费现状及市场前景,提出了发展我国环氧氯丙烷生产的一些建议。
近几年来,随着高科技的发展,薄膜技术已成为一门综合性的应用科学。本文以二氧化钛为例,从原理、特点、影响因素等方面详细介绍了制备薄膜的化学方法:溶胶-凝胶法。
在伴随经济高速增长与财富急剧增加的同时,我国大部分企业重点强调经济效益增加,却忽略了对生态环境保护的重视,以牺牲环境为代价来换取经济的高速增长率。为构建一个和谐的
<正> 镶条是机床尺寸间隙调整的重要零件,其精度好坏直接影响机床的装配质量和工作性能。过去我们采用划线、刨斜度、最后钳工反复多次刮削成形。由于磨损了的机床导轨间隙各
期刊
介绍了离子膜法制碱生产中废氯气的处理原理及工艺,指出了工艺操作的注意要点。
基于转向器的国家检测标准,设计并开发出检测齿轮齿条转向器综合性能试验台。
新时代,企业应当充分突出税法与税收政策的优势,科学统筹税收筹划工作,不断减少自身所面临的税负压力,且与国家税法政策匹配,其是国内企业在发展期间必定会遇到的情况,同样是