面向社交网络的情感分析方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:sunzzy120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着Web2.0的发展和移动便携式设备的普及,脸书、微信等在线社交网络如雨后春笋般兴起,它的发展使得网络世界向现实世界的无限靠近成为可能,其中微博类应用(如新浪微博、Twitter等)的使用率遥遥领先。在线社交网络中,用户可以管理他们的社交网络和社交身份,发布各种话题信息,也可以通过好友关系获取其他用户发布的信息。由此产生的大量文本数据吸引着越来越多的学者对其展开研究,文本情感分析成为社交网络数据分析的热点,在学术领域、社会领域和商业领域都有着重要的应用价值。但目前的社交网络情感分析多只针对文本进行分析且假设文本是独立同分布的,忽略了社交网络中其他信息对于情感分析的影响。针对此问题,本文以真实的在线社交网络数据为研究对象,结合社会学、心理学的基本理论,利用在线社交网络的基本性质,由浅入深地对社交网络中的文本情感分析展开研究。本文的主要研究工作包括以下四个部分:
  首先,针对传统微博情感分析方法假设文本独立同分布且忽略微博间的关系,造成情感分析结果不理想的问题,提出一种基于用户结构相似度和话题上下文的情感分析方法。该方法利用用户结构相似度考虑共同朋友关系(二度关系)对情感分析潜在的影响,并对其进行形式化表示;考虑到微博文本内容的多样性,引入微博的话题上下文来表示微博间的语义关系,同样对其进行形式化表示。在此基础上,将用户结构相似度和话题上下文统一表示为社交上下文,结合微博文本特征分类器,建立新的微博情感分析模型。广泛的实验和统计学分析结果表明,该方法能够在微博情感分析上取得超越传统方法的准确率。
  其次,针对传统情感分析方法对微博间广泛存在的异构关系提取不充分,影响情感分析准确率的问题,提出了一种基于微博弱依赖关系的情感分析方法。根据社交网络同质性理论,社区结构是社交网络中广泛存在的一个特征,社区中的节点经常共享某些性质。基于此,该方法假设社交网络的社区结构与微博情感倾向之间存在关联关系,并对该关联性进行统计学上的验证。该方法首先根据用户上下文、用户关系上下文建立微博关系图,然后利用社交网络的集群性质,使用社区发现算法提取微博间的弱依赖关系,同用户上下文、用户关系上下文一起进行形式化表示,最后结合微博的文本特征分析其情感。在两个真实数据集上的实验结果表明,该方法在情感分析上有着良好的准确率。
  再次,针对少数利用社交上下文的微博情感分析方法多基于最小二乘法等传统机器学习,只能在模型训练阶段利用社交上下文,且不能挖掘文本和社交上下文深层特征的问题,提出一种基于社交上下文表示学习的微博情感分析方法。该方法根据情感一致性和情绪感染性理论建立微博关系图,利用深度学习算法将该图中的节点映射到连续分布的低维实数向量空间中,以求能够挖掘出微博关系的深层信息。建立一个基于长短期记忆网络的神经网络模型,微博社交上下文向量在此模型中可以参与到不同信息的计算中,从而保证对社交上下文信息的最大化利用。此外还引入了注意力机制处理情感分析中不同的词语贡献不同的情况。三个真实数据集上的实验结果表明该方法在情感分析上具有良好的准确率、精度及F1-score值。
  最后,对社交网络情感分析的重要应用之一——突发事件发现进行了研究。针对现有的突发事件发现方法存在准确率和效率较低的问题,提出一种基于情感同现图和标签提取的突发事件发现方法。该方法首先离线构建一个基于Plutchik情感轮定义情感类型的情感同现图。与传统的情感二分类、三分类方法不同的是,利用情感同现图可以实现对微博数据流细粒度的、无监督的情感分析,从而将微博数据流划分为不同的、微博数量相对较小的情感数据流。然后,在得到的情感数据流上进行突发状态检测,并提取突发期内的话题标签。最后,对话题标签进行分词,获取突发事件候选词,选择情感数据流中与事件候选词相关性较高的词语及突发事件候选词作为描述突发事件的关键词。在检测出突发事件的同时,该方法还能分析出社交网络用户对于突发事件的情感倾向。实验结果表明该方法的准确率高,识别突发事件时间短。
其他文献
NO是燃煤锅炉排放的污染物之一,它会严重影响人类健康,并能形成酸雨.因此,控制NO排放十分重要.分级燃烧包括空气分级和燃料分级,是一种经济而有效的低NO燃烧技术,但其在国内煤粉炉上尚未广泛应用,在数量极大的层燃炉上更是有待开发研究.为此,该文首先对NO生成和破坏机理进行了详细的分析,为该次研究提供理论基础,同时也作为层燃炉实验的分析依据.最后,为了研究层燃炉内气体燃料分级低NO燃烧技术,专门搭建了
学位
该文对其进行了大量的理论分析和反应机理研究.另外,由于固硫剂颗粒在炉内停留时间短,而反应时间及SO浓度会对脱效率有很大影响,因此该文对固硫剂喷射装置进行了设计、试验,并通过数值计算进行验证和解释.通过O/CO气氛中喷钙脱硫反应的分析后,该文首先针对CO对CaCO煅烧分解反应的影响进行了研究.与一般采用经验公式的方法不同,该文通过化学热力学分析计算得到了较为精确的反应平衡关系式,然后通过热重分析(T
由于贫煤的着火特性和燃尽特性较差,采用分级燃烧技术来降低贫煤锅炉的NO排放时,往往会导致飞灰含碳量升高、锅炉热效率降低的问题.为实现大型贫煤锅炉的高效低NO运行,该文对分级燃烧过程中影响贫煤NO排放及燃尽的各种因素及其燃烧技术进行了深入系统的实验研究和数值模拟.
学位
该文主要对有源电力滤波器系统中的谐波电流检测电路进行了分析研究,并用MATLAB软件进行了电路仿真.通过仿真电路观测了谐波电流检测电路的检测效果,并对d-q谐波电流检测电路与自适应谐波电流检测电路进行了比较;同时还对有源电力滤波器的变流器控制方式进行了研究,提出了一种双重预测控制方法.最后,该文对有源电力滤波器的整个系统做了分析,指出了谐波及无功被深装置的发展方向——混合型有源电力滤波器.
激光诱导击穿光谱(Laser induced breakdown spectroscopy,LIBS)技术作为一种发射光谱分析技术,因其具有远程非接触测量、分析时间短、多元素同时检测、快速实时在线分析等优点,被公认为是一种具有广阔应用前景的元素分析技术,可有效的对物质的成份和含量进行检测分析。LIBS技术自问世以来,广泛的应用于环境检测、冶金过程、煤质分析、深空探测、地质研究等方面,此外,LIBS
近些年来各种类型的数据信息呈爆炸式的增长,对于数据信息处理的需求也在日益不断提高,于是机器学习中的数据挖掘技术逐渐受到了越来越多人的青睐,并且其在各行各业中得到了普遍的应用。人们对庞大数据的分析从以前的手动分析,逐渐转变为利用更加智能便捷的数据挖掘技术对数据进行分类与整合,数据分类在数据挖掘技术中饰演着至关重要的角色。  关于在数据挖掘中分类方法的研究,是人类对提升分类精度孜孜不倦的追求过程。本文
学位
当对系统进行建模时,由于建模误差、内部扰动和环境变化等因素,时滞和非线性是不可避免的。conic非线性系统是一类特殊的非线性系统,它位于超球面内,中心是一个线性系统,半径以另一个线性系统的范数为界。事实上,工程建模中存在很多conic非线性,如二极管和放大器中的局部正弦非线性、死区非线性、分段线性函数和Lipschitz非线性。另一方面,跳变系统作为一种特殊的随机切换系统,近几十年来引起了广泛的学
随着科技及社会的发展,室内人体检测技术得到了越来越广泛的关注与应用,因此也对室内人体检测的准确率提出了更高的要求。传统的人体检测方法如传感器、红外射线以及视频获取的形式对目标环境中的人体进行检测,存在一定的局限性。随着无线网络技术的发展,基于信道状态信息的人体检测技术应运而生。相比于传统的人体检测方法,此方法具有准确率高、普适性更好等特点,但依然容易受到室内环境、噪音等影响。因此,急需一种新的行之
学位
随着信息时代的到来,网络改变了人们表达观点的方式,人们开始主动地发表自己的意见和评论。在这种趋势下,网络上出现了越来越多的文本资源。通过挖掘和分析这些文本资源中的情感信息可以了解人们对其他人、事、物的看法,具有十分重要的实际应用意义。当下在情感分析中主要使用的方法包括基于情感词、基于机器学习和基于深度学习的情感分析方法,其中深度学习的方法由于其自主学习能力和在大规模数据上表现出的优势,成为当下最热
学位
随着社会生产的快速发展,对解决优化问题的需求越来越迫切。确定性优化算法在许多优化问题上的效果不好甚至无法使用,而演化算法是解决此类问题的重要工具。近年来,许多演化算法包括群智能算法被陆续提出。然而,没有免费午餐理论指出没有任何一种优化算法可以在所有类型的优化问题上都表现的比其他算法好。还有研究表明,存在对某一种算法来说比较困难的问题,对另一种算法却比较简单的情况。因此,不同优化算法的集成或协同以及
学位