论文部分内容阅读
随着互联网的普及和发展,越来越多的网络用户倾向于在各种互联网应用上进行消费和娱乐。各类互联网平台都开通了评价功能,使得消费者可以在各种应用平台上发表自己的观点,由此产生了海量的蕴含了用户观点态度和情感倾向的产品网络评论。这些在线评论一方面是其他消费者做出购买决策的重要参考信息,另一方面也能反映消费者对产品以及商家服务的情感极性。充分挖掘评论中的消费者情感倾向并进行分析,有利于商家进行需求驱动的产品优化,进而提高产品和服务质量,吸引更多顾客。本文针对中文在线评论的特点,设计了一种基于深度学习的在线评论情感分类模型和一种从负向评论中挖掘对消费者具有重要影响的代表性评论。这两个模型能够更加准确的对消费者在线评论进行情感分析并挖掘对消费者具有重要影响的代表性评论。主要研究如下: 1.针对传统机器学习模型严重依赖模型的特征选择和参数调优,提出将卷积神经网络与双向长短时记忆神经网络进行结合用于解决在线评论的情感分析问题。该方法不仅可以像长短时记忆神经网络一样建立时序关系,而且可以像卷积神经网络一样刻画局部空间特征。医疗服务、物流快递、金融服务、旅游住宿和食品餐饮数据集实验结果表明,该方法能有效判别消费者在线评论情感倾向,在文本的情感分类中效果较传统机器学习算法更准确,F1值可以达到94%。同时,实验证明该方法具有较好的领域可拓展性。 2.在情感分类的基础上,针对得到的负向评论中隐含主题之间具有的“普遍联系”和“语义内聚”的特点,使用高斯LDA主题模型挖掘负向评论信息中丰富的主题信息,将负向评论表示为话题分布的形式。在此基础上,通过AP聚类算法的训练,自动将话题相似的负向评论聚为一类,并将各个类别的中心评论作为该类别代表文本,以此降低冗余的评论信息,帮助商家更高效准确地挖掘对消费者具有重要影响的代表性评论,分析商品和服务中的关键问题,进而针对性的完善产品功能和服务质量,给用户提供质量过硬的产品和优质服务。