云环境下基于多目标优化算法的微博意见领袖挖掘

被引量 : 1次 | 上传用户:atmip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着互联网的普及,人们的交流方式也发生了翻天覆地的变化。微博作为一种新兴的网络信息传播媒体受到广大网民的追捧,它的时效性和裂变性可以使信息在很短的时间内得到广泛的传播,因此对信息的有效控制就变得十分重要。因为,一旦有人蓄意传播虚假信息或者危害社会安全的言论,后果将十分严重。那么,对在网络信息传播中占主导地位的意见领袖的挖掘和监控就显得意义重大。目前对于意见领袖的挖掘方法主要有统计学方法、聚类分析法、基于SNA社会网络分析法等,这些方法都有各自的特点,但是面对331亿微博网民所产生的海量微博数据,它们并没有表现出很好的处理能力。本文以微博用户属性为立足点,将其多个属性特征与多目标优化问题结合起来,提出把Skyline查询引入到微博意见领袖的挖掘中,Skyline查询是解决多目标优化问题的一类方法。面对海量的微博数据,本文引入Hadoop关键技术MapReduce框架,将Skyline计算中的BNL块嵌套循环算法和SFS排序过滤算法在该编程框架下实现,使其在处理海量数据时有更好的性能。接着对意见领袖评估模型进行建立,提出从用户影响力和用户参与度两个指标评价微博意见领袖,并利用AHP层次分析法确定各属性权重,最后给出意见领袖计算公式。在挖掘实验阶段,搭建Hadoop集群环境,设计微博爬虫获取微博数据,将数据用并行化后的SFS算法进行处理,再将处理结果运用于意见领袖模型中进行计算。最后将本文挖掘的意见领袖与新浪微博官方人气用户进行对比,结果显示本文的方法挖掘出的意见领袖分布领域相对广泛,在一定程度上避免了新浪微博官方用户排名中娱乐人物一家独大的现象。因此,本文的思路可以作为一种解决方法,处理海量、高维数据,为微博意见领袖的挖掘提供了一种可能的选择。
其他文献
短视频在近几年内的发展如日中天,出现了"短视频热"的社会现象。短视频迅猛发展不仅有其深刻的时代、技术和商业背景,也与短视频本身的特点密切相关。作为一种新兴媒体形态,
北极海冰融化使北极问题呈现全球化的趋势,大北极便是此趋势的体现。大北极由于涉及范围较大而难以进行整体研究,研究大北极问题需对其进一步划分:传统东北亚无法体现其政治格局
跳远的助跑技术比一般跑的技术要复杂的多,要求运动员跑的即放松、快速又要准确。因此,应该对跳远运动员进行专门的速度训练。通过采用跳远运动员专项速度训练模式对高水平跳
基于甘肃省16个气象站1961—2010年改进气象干旱指标(MCI)对甘肃省近50年不同季节的干旱特征进行了统计分析。结果表明:春旱和夏旱发生频率最高,为55.4%和55.0%;秋旱发生频率最
目的:探讨绝经后妇女肾虚证与亚甲基四氢叶酸还原酶(methylenetetrahydrofolate Reductase, MTHFR)基因多态性的相关性。方法:参照由邓铁涛主编的《中医诊断学》、以及严石林制
临床生物化学检验技术这门课程是医学检验技术专业的重要专业主干课程,紧密结合于日后的临床工作。在检验专业“五改四”更加注重技能培养的大背景下,如何培养适应时代发展的
城市道路交叉口是城市的重要空间节点,具有传达城市形象、塑造市民生活的作用,它整体的形态直接关系到城市意象的传达和城市公共空间场所的营造,所以对它要进行深入的研究。本研
伴随着全球变暖的不断加剧,北冰洋作为连接太平洋和大西洋最短的天然海洋通道,其战略价值日益凸显。加之北极地区资源储量丰富,因此,北极航道的开发利用受到世界瞩目。东北亚