论文部分内容阅读
随着互联网技术的不断发展,我们正逐渐迎来了大数据时代,越来越多的人习惯于将自己的想法、感受发布到网上,尤其是网购的兴起所带来的海量的信息评论,对于这些能反映消费者情感倾向的信息进行分析挖掘,已成为商家改进产品、提升竞争力不可或缺的手段。毫无疑问,良好的用户评论是商家的一项无形资产、无成本的广告;然而不理想的用户评论,则会大大减低商家信誉。因此商家需要及时地搜集消费者对其商品的评论信息进行必要挖掘分析,以便发现产品的不足之处,采取有效措施提高商品质量,以形成一个良好的评价信息。然而,网购评论文本信息的迅速增长,其量之大很难依靠人工的方式进行收集、处理、分析。而且这些文本信息大部分是用非结构化或半结构化的方式呈现的,这样就更加增加了分析的难度。目前来看,较为理想的处理方法是选择文本挖掘下的情感分析技术来解决此类问题。本文正是基于情感分析技术这一当前热点分析方法,并以华为荣耀手机这个以互联网思维营销的产品为例,利用python软件从海量评论语料中爬取相关有用信息,并对这些信息进行处理分析,以此帮助商家深入了解消费者的真实需求,发现目前产品的不足之处。而后,通过更加人性化的产品设计来赢得顾客的青睐,从而获得行业竞争力。本文主要研究过程主要分为四个环节。首先,利用python获取相关评论信息的抽样数据;然后,基于结巴分词算法对爬取的评论数据进行切句、分词、词性标注和哈工大LTP平台的依存句法分析等预处理工作;接着,探讨比较了基于词性标注与依存句法两类方法在特征词、情感词对抽取方面的优劣;最后,本文的创新点在于依据不同的评价句型,构建了多策略情感分析方法,同时在特征词的情感值计算方面给予初次评价与追加评价不一样的权重设置,并且对含否定词修饰的句式给予特别的处理。结果显示,目前“华为荣耀6”手机在电池耗电量、待机时长、手感、游戏等特征方面需要加强改进,特别是电池和待机这两个特征,消费者的负面情感最为显著,生产者对此需要引起足够重视;在产品性价比、摄像头、像素等方面做的还不错,得到消费者的普遍认可。