论文部分内容阅读
随着股票市场的快速发展,越来越多的投资者喜欢在金融网站上发表评论,投资者可以通过这种方式发表自己对于个股或者大盘的看法,因此互联网上的股票评论文本也越来越丰富,与此同时,投资者对股票评论信息的需求也大大增多。网络上由用户自己发表的股评信息的情感倾向在某种程度上影响着个股以及大盘的走势,为了辅助证券投资者进行个股决策,我们需要对股票评论进行更深一步的情感倾向性分析。人工判断股票评论的情感倾向性的工作量巨大,迫切需要一套面向股票评论的自动文本情感分析技术和工具。因此,本文主要从以下几个方面进行了研究。(1)研究了一种基于情感词典的股评情感倾向性分析方法。一方面通过借鉴机器学习中语料学习的思想,引入了股票领域的情感词,另一方面考虑到了程度副词和否定词对情感分类造成的影响,构建了否定词典和程度副词词典这两个辅助词典,然后根据各个词典的匹配结果按照一定的规则完成了面向股票评论的情感分析,实验结果表明,无论在准确率上还是在召回率上,这种方法都要比传统的基于情感词典的方法要高。(2)研究了一种基于长短期记忆人工神经网络(LSTM)的情感倾向性分析方法。基于LSTM网络搭建了一个面向股票评论文本情感分类的深度学习模型,将经过word2vec生成的词向量作为输入,然后利用LSTM网络生成句子或篇章向量表示,接着将生成的句子或篇章向量作为输入,通过调用Softmax激活函数完成对评论文本的情感分类,不仅解决了(1)中提出的方法准确率不高的问题,还能更好的利用句子和篇章中的语义信息和词序信息进行情感分类。(3)研究设计了一套面向股票评论的情感分析系统。本文将(2)中提出的方法应用到实际数据中,构建了一套面向股票评论的情感分析系统,辅助证券投资者进行个股决策,同时验证了本文提出方法的可用性。