论文部分内容阅读
目前,国家经济的迅猛发展和网络的普及,促进了互联网行业的高速发展,拉近了人与人之间的距离,也拉近了人与商店之间的距离。在2020年疫情期间,我国网民规模进一步扩大,人们通过手机、电脑等工具,在社交平台分享生活,表达自己的观点,汇聚了大量的文本数据。通过这些文本数据,研究网络用户对实体以及属性所表达的观点和态度对现实生活具有重要意义。以京东笔记本电脑商品评论为例,传统的情感分析只是对整条评论的情感倾向进行判别。而对于商品中出现的其他消费者关注的方面的情感倾向没有做出评价,可以说传统的情感分析是单纯粗略的情感分析。商品评论文本长度差异过大,以往研究中对过长文本进行截断处理,传统的情感分析在文本上提取的信息并不完整,对消费者所关注商品的某些属性无法做出分析。根据分析中出现的问题,本文使用了卷积神经网络,循环神经网络,长短期记忆网络等深度学习分类模型,研究基于深度学习的情感分析方法。本文爬取京东商城中笔记本电脑的评论作为实验数据,使用CBOW和BERT模型进行词嵌入,将得到的词向量矩阵分别传入到卷积神经网络,循环神经网络,长短期记忆网络三种分类模型进行情感分类。对比模型的分类效果发现,BERT模型的词嵌入模型效果表现最好,但是运行效率较慢。长短期记忆网络的accuracy值,recall值和F1值均高于其他分类模型,长短期记忆网络分类效果最好。在对产品评价要素进行分析时,对文本数据提出了七个关注特征,根据评价要素提取规则抽取主题词和感情词作为输入。本文构建了基于长短期记忆网络和逻辑回归的BLCL模型,并对长短期记忆网络和逻辑回归在模型中所占的权重进行了研究,权重分别为0.72和0.28,最终BLCL模型的准确率达到了94.65%。综上所述,本文构建的BLCL模型能够在一定程度上挖掘文本的语义信息,而且能较为有效挖掘评论文本主题词与情感词信息,能够缓解文本长度差异过大造成的关键信息缺失问题,更为有效解释了文本的整体情感倾向以及文本内评论主题的情感倾向。