面向社交媒体的个性化情感分析与立场挖掘方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:mijun123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的深入发展与普及,社交媒体已经渗透到社会生活的方方面面,成为人们传播信息、分享情感和表达意愿最主要的渠道之一。互联网用户在社交媒体平台上通过发布内容、参与评论等形式表达对特定对象、事件或话题的情感与立场。面向社交媒体文本的情感分析与立场挖掘可以帮助人们发掘公众观点、及时了解和掌握舆情动态,在商业、安全等领域中具有十分重要的研究和应用价值。本论文工作聚焦社交媒体文本的情感分析与立场挖掘问题,探究用户个性化信息在情感分析中的应用,并研究话题信息对多方立场挖掘的作用。采用社交媒体数据集,包括新浪微博数据集、Twitter数据集等,对提出的情感分析与立场挖掘方法进行了有效性验证。  本论文的主要工作和创新点归纳如下:  1.探究性格因素在社交媒体情感分析中的作用,并首次提出一种基于Big Five性格模型的情感极性分类方法。该方法根据用户的不同性格维度对社交媒体文本进行分组,从而挖掘不同性格维度对应的个性化情感特征,并通过集成学习融合个性化与通用情感分类结果,以提升现有情感分类方法的效果。最后,采用实验方法验证了所提出的个性化社交媒体情感分析方法的有效性。  2.在立场挖掘领域,首次开展面向多方实体的立场挖掘研究,并提出一种融合双层话题信息的多方立场挖掘方法。该方法利用社交媒体文本中与特定立场相关的话题信息细颗粒度地刻画不同立场的词汇特征,并挖掘与立场无关的通用话题进一步提升立场分类效果。最后,采用实验方法验证了所提出的多方立场挖掘方法的有效性。  3.为减少多方立场挖掘所需的人工标注数据,同时保证分类性能,提出一种基于用户立场一致性与话题信息的半监督多方立场挖掘方法。该方法采用自训练方式、利用少量已标注文本和大量未标注文本迭代训练立场分类模型,并根据用户立场一致性与话题信息选择高置信度分类样本用于扩充训练文本集合。最后,采用实验方法验证了所提出的半监督多方立场挖掘方法的有效性。  4.在所提出的半监督多方立场挖掘方法基础上,进一步提出一种基于话题建模的弱监督多方立场挖掘方法。该方法首先运用情感分析自动标注少量文本的立场,再利用大规模文本之间的内在语义关联提升对噪声标签的鲁棒性。该方法通过扩展话题模型得到具有立场区分性的话题,并基于话题相似度确定文本立场。最后,采用实验方法验证了所提出的弱监督方法在多方立场挖掘中的有效性。
其他文献
H.264/AVC是目前国际上最新一代的视频编解码标准,由国际电信联盟ITU-T以及国际标准化组织ISO/IEC的相关专家所成立的联合视频组JVT共同开发制定。该标准采用基于块的混合编码
本论文分为两部分:人工神经网络在天然产物结构分析中的应用和火热症类型分析。 天然产物尤其是海洋天然产物是目前国内外药物学家、天然产物学家、化学家等研究重点。天然
表面肌电(surface Electromyography, sEMG)信号是一种复杂的人体表皮下肌肉电活动在皮肤表面处时间和空间上的综合结果,是从人体骨骼肌表面通过非侵入方式记录下来的神经肌
随着陆地资源的逐渐减少,人们把目标转向了占地球表面积71%,并含有丰富资源的海洋。为了人类能够更好的利用和管理海洋资源,需要对海洋进行持续的研究以获得对其动态性能的理解,以
Monte Carlo(MC)方法是模拟生物组织内光子传输的最常用手段之一,其模拟结果的准确性也得到了多方面验证。实验室基于MC方法,开发了生物自发光前向仿真平台M0SE(Molecular Opti
能源犹如人体的血液。随着社会经济的飞速发展,能源和资源的消耗速度越来越快,节约能源,保护环境已经成为人类可持续发展的必要条件,人们的注意力正转向可再生能源的利用和发
自主目标检测和跟踪技术是无人机自主能力中的重要体现,在无人机导航、搜索、精确打击、以及打击后的效果评估等方面发挥着重要作用。由于视觉信息的丰富性、及其传感器系统的
本课题是防空反导实时闭环火控关键技术的子课题。课题提出了一种区域定位系统方案以满足炮弹制导的需要,并摆脱对GPS的依赖。本文以此为背景,分析了区域定位系统接收机的功能
多尺度现象是客观世界的普遍现象,但多尺度科学是近几年才提出的。多尺度科学是一门研究各种不同空间尺度或时间尺度相互耦合现象的科学,是目前科学研究的热点和难点之一。在信
本论文以某型高炮武器数字化改造项目为背景,以高炮武器综合管理计算机系统设计为研究内容,分析了高炮综合管理计算机系统的功能及设计要求。文章重点阐述了高炮武器综合管理