【摘 要】
:
随着信息时代的到来以及电商行业的快速发展,越来越多的人通过互联网发表自己对某些事物或事件的观点。商家通过分析消费者在平台上的反馈能够更加准确且快速地了解消费者对产品的需求,从而改进目标产品,并制定更合适的销售计划,以实现收益最大化。消费者通过分析他人留下的评论信息对产品有更加深入的了解,从而更好地判断出对产品的需求度。基于方面级的情感分析任务作为自然语言处理领域的一个重要研究方向,能够更加细致的对
论文部分内容阅读
随着信息时代的到来以及电商行业的快速发展,越来越多的人通过互联网发表自己对某些事物或事件的观点。商家通过分析消费者在平台上的反馈能够更加准确且快速地了解消费者对产品的需求,从而改进目标产品,并制定更合适的销售计划,以实现收益最大化。消费者通过分析他人留下的评论信息对产品有更加深入的了解,从而更好地判断出对产品的需求度。基于方面级的情感分析任务作为自然语言处理领域的一个重要研究方向,能够更加细致的对带有情感色彩的评论文本进行情感极性分析。
传统的词嵌入模型word2vec和Glove只能生成具有单一语义特征的词向量表示,忽略了单词与上下文之间的关系,单层注意力网络只能获取不同单词的注意力权重,无法获取不同句子的注意力权重,忽视了句子对情感极性判断的重要性。针对上述问题,本课题提出一种基于BERT和分层注意力网络的方面级情感分析模型。首先使用BERT预训练模型生成包含上下文语义信息的词向量,同时加入方面编码向量,两者融合得到新的词向量表示;接着单词注意力层利用双向GRU网络提取单词上下文特征,并使用注意力机制对其进行权重分配,突出重点信息;之后句子注意力层通过双向GRU网络提取句子上下文特征,使用注意力机制对其分配权重,然后进行加权求和得到文本信息;最后经过输出网络层得到最终的情感极性。
本课题使用的数据集是SemEval2014Task4中的Restaurant数据集和Laptop数据集,以及在骚证方面级情感分析模型时常用的Twitter数据集。实验结果表明:基于BERT和分层注意力网络的方面级情感分析模型能够更有效地获取深层情感特征,在三个数据集上的准确率分别达到82.14%、77.59%、73.84%,所对比的其他方法,分类准确率都有不同程度的提升。
其他文献
激光脉冲整形技术是高功率、高重复率、可调谐TEA CO激光器研究和利用TEA CO激光研制差分吸收雷达、高次谐波发生获得3~5um中红外激光研究中必不可少的重要技术.等离子体开关是目前应用较广的一种简单可行的激光脉冲整形技术.通常情况下,TEA CO激光的脉冲输出波形是由增益开关动作产生的主脉冲以及接续它的很长的拖尾组成,这段占脉冲大部分能量的拖尾,不仅导致差分吸收雷达的距离分辨率降低,而且在倍频
该文回顾了国内外S激光器发展历史,分析和总结了前人的研究结果.在此基础上,开展了小型化放电型S激光器的研究.首先从理论上进行了宏观量的计算.讨论了实现粒子数反转的条件.详细讨论了Blumlein脉冲放电电路在研究人员研制的放电型S激光器中的应用.分别使用HY-3202氢闸流管和多通道火花隙,充气火花隙作为电路的触发快速转换开关,研究了它们的导通特性.通过比较,充气火花隙性能最稳定,开关速度最快,以
以la掺杂Pb(Zr,Sn,Ti)O反铁电相变陶瓷为研究对象,从结构、性能与应用的角度出发,深入系统地研究了铁电-相界附近,组份、温度、电场、压力变化对相结构和相变 性能的影响,揭示了场诱相变临界参数变化规律及相互关系.将温度诱导的Fe-AFE相变与电场诱导的AFE-FE相变和压力诱导的FE-AFE相变联系起来,详细研究了它们之间的内在机制.对场诱相变所产生的各种宏观效应-电致应就、压致相变电茶释
在这个科学技术不断发展和进步的时代,人们已经不满足于现有的通信速率和通信质量。满足上述要求的多输入多输出(multiple-input multiple-output,MIMO)技术得到了快速发展,其通过在收发端分别配置多根天线来对信息进行发送和接收,使得整个通信系统的传输速率大大增加。但在MIMO系统中,多天线收发会使系统性能受信道间干扰(inter-channel interference,I
滚动轴承是旋转机械设备中关键零部件之一,在不同工业领域中应用广泛。但在实际工作中轴承工况不断变化导致大量有标签数据获取困难,同时传统寿命预测方法存在健康指标难以构建及寿命预测误差大的不足。因此,能够准确预测滚动轴承的剩余使用寿命对工业生产具有重大意义。本文针对不同工况滚动轴承剩余使用寿命预测提出一种方法,该方法分为状态识别与寿命预测两部分。状态识别方面:提出基于深度模型迁移的滚动轴承状态识别方法。
图像是人们从客观世界获取信息的重要来源。然而,受环境以及成像设备的影响,获取的图像经常存在遮挡、扭曲、光照不均、边缘模糊等问题,导致图像中有效信息不能充分利用。这些低质量图像会给后续图像的处理,譬如图像中文本的定位与识别,带来很大的困难。目前基于深度学习算法的文本定位与识别算法在处理高质量图像时较传统的文档文本定位与识别技术有显著优势,但是在处理低质量的图像时,定位与识别效果仍然不理想。本文针对提
核磁共振成像(Magnetic Resonance Imaging,MRI)过程中,由于受自身成像机制的影响,以及遵循奈奎斯特采样定理将耗费大量的采集时间,长时间的扫描操作容易引起患者感到不适,并且可能会引入运动伪影。近年来,基于生成对抗网络的压缩感知(Compressed sensing,CS)核磁共振重建算法在重建时间上有了较大的提升,但是由于原始的生成对抗网络存在训练稳定性差、困难和模式崩溃
随着信息技术与人工智能的发展,人们在日常生活中接触到的图片越来越多。图片中包含了大量的信息,因此通过文本检测与识别提取图片中的信息变得尤为重要。伴随着计算机视觉技术的快速发展,提高了人们对自然场景文本信息的检测与识别的要求。自然场景文本检测是从背景复杂的图片中得到文字的位置信息。通过检测与识别自然场景中的文本可以应用于工业自动化、车牌识别、智能机器人、智能翻译等领域。准确快速地检测场景文本成为科研
语音信号是生活中最为常用的沟通信号,其中包含大量语言和情感信息。随着技术发展,其被广泛应用于智能控制、生物医疗和电子金融等多种领域,语音信号分离技术是语音识别和语音增强等技术的基础,如何在复杂环境下,对观测信号中特定语音进行准确分离具有重要研究价值。针对语音分离技术主要有两种思路,一种是基于信号处理的非深度学习方式,亦可以称其为传统算法,另一种是基于深度学习进行分离操作。本文针对传统算法中适定盲源
分布式光伏并网发电系统在缓解能源危机以及生态污染等方面都发挥着重要作用,为大电网的健康发展提供了新动能。然而伴随着许多光伏电力的并网,给电力系统工作的安全性带来了更高的技术要求,其中孤岛检测为光伏并网发电系统的关键技术之一。目前防孤岛检测方法大多数在单逆变器系统中效果更为突出。然而,如果仅仅应用单逆变器系统则很难达到当前的电力需要标准。本文就多逆变器并网系统展开分析,探究怎样对主动式频率偏移检测方