【摘 要】
:
近年来,随着微博的快速发展,微博数据成倍增长,如何利用这些海量的数据,挖掘有用的信息,成为了研究热点。其中,微博情感分类是一个比较热门的研究方向,它在分析与预测时事走
论文部分内容阅读
近年来,随着微博的快速发展,微博数据成倍增长,如何利用这些海量的数据,挖掘有用的信息,成为了研究热点。其中,微博情感分类是一个比较热门的研究方向,它在分析与预测时事走向、反馈商品和产品意见、分析消费者喜好、政府网络舆情监控等方面都有广泛的应用。微博情感分类研究分为以下三个方面:基于情感词典的分类、基于机器学习的分类和基于特征融合的分类。由于微博信息量少、格式不规范、语言风格多变、含有大量的噪音等原因,微博情感分类研究的效果不理想。针对这一情况,本文结合了现有的情感分类算法,针对微博信息的特点,设计并实现了三种微博情感分类方案,提高微博情感分类的效果。本文主要贡献包括:1、设计了基于情感计算的情感分类算法。该算法的基础是情感词典,目标是包含有很明显的正、负情感词的微博。在传统以单个情感词典为核心的情感分类的基础上,该算法结合了四个常用的情感词典,从多个维度描述微博,通过计算微博包含的情感词的情感倾向,计算微博的情感倾向,从而判断微博的情感分类。2、设计了基于分类器融合的情感分类算法。该算法的基础是机器学习,它适合大量数据处理。该算法详细的分析了基于机器学习的情感分类方法,结合了三个常用的分类算法,提取三个不同分类器的预测标签和预测得分,根据融合分类器,预测微博的分类标签。3、设计了基于特征融合的情感分类算法。该算法把人类情感分析和机器学习方法相结合,先分析微博本身特有的特点,并且根据人类情感的表达方式,选取了四组特征;然后,选用了客观的统计特征;最后,把两方面特征融合,用SVM训练模型,预测微博的情感分类。通过实验证明了本文设计的方法可以有效的提高微博情感分类的能力。
其他文献
ARM Cortex-A15系列处理器是当前最新的嵌入式ARM SoC,该系列处理器首次集成了Mali-T600系列的移动GPU,该系列GPU率先支持OpenCL计算框架,可以利用GPGPU (General-Purpose co
数据库是信息系统的核心,集中存放着大量重要而又敏感的数据,是最吸引攻击者的目标,一旦数据被黑客窃取或者是破坏,其损失难以估量。传统的数据隔离技术不能有效地防护黑客的
随着计算机和网络的飞速发展,我们已经进入了数据信息爆炸式增长的时代,如何从海量的非结构化信息中提取真正满足用户需求的信息,已经成为一个越来越重要的研究课题。自然语
跟踪视频中的运动目标是计算机视觉领域中富有挑战性的课题之一,在视觉导航、安全监控等领域有着广阔的应用前景。开发鲁棒的跟踪算法也具有重要的理论意义。文献中广泛使用的
随着微博服务平台的快速发展,使用微博的用户数也越来越多。人们基于此传播和获取与热点事件相关的信息,这些微博的内容高度相似,信息质量参差不齐,亟需相关技术将其梳理。给
近年来,随着定位技术与无线通信技术的迅速发展,对移动对象进行跟踪与定位变得可行与必要。目前分布式时空数据的查询解决方案是将分散在世界各地的数据服务器都接入到互联网中
目前越来越多的企业采用基于WEB模式的系统作为企业信息发布、交换、管理、交易的平台。但随着电子商务的发展,B/S结构的WEB系统在用户界面与服务器交互方面的不足逐渐体现了
软件测试作为软件工程的一个重要组成部分,备受研究学者的关注。然而软件测试的花费是极其庞大的,至少50%的软件开发成本用于软件测试,回归测试作为软件测试的一个重要环节,
在网络研究领域,模拟技术已经成为在各种条件下研究网络运行状况和性能的重要方法。但是复杂的大规模网络模拟会消耗大量的计算机资源,甚至规模过大的模拟任务根本无法在一台
近几年里,软件外包已经成为世界软件产业发展的一个重要趋势。越来越多的企业寻求外包软件开发商,当面对越来越多的市场外包软件开发商需求时,对软件外包服务的质量评价的需求也