面向微博的PageRank算法的改进与应用

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户：anknn21

【摘要】

：

从海量数据下的社会化网络中识别出各个领域下产出高质量内容的具有一定影响力的专家，进行具有针对性的广告推荐与决策支持，已经成为微博数据挖掘亟待解决的问题之一。从微博的

【作者】

：

原野李晨田丽华

【机构】

：

西安交通大学软件学院,新浪网技术（中国）有限公司

【出处】

：

计算机应用与软件

【发表日期】

：

2017年3期

【关键词】

：

微博用户影响力 PageRank Spark 大数据

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

从海量数据下的社会化网络中识别出各个领域下产出高质量内容的具有一定影响力的专家，进行具有针对性的广告推荐与决策支持，已经成为微博数据挖掘亟待解决的问题之一。从微博的用户特征和行为特征出发，确定了采集博文的规则与互动量计算公式，并应用PageRank算法对微博用户影响力计算时存在的数据陈旧性和主题不相关性的问题进行了改进，最后分别基于MapReduce和Spark的并行计算框架对算法进行了实现。实验结果表明，该挖掘方法具有较好的准确性，在Spark并行计算框架下表现出较高的性能，尤其适合大规模数据集的场景。

其他文献

谈《先秦诸子选读》中蕴含的德育价值及教育启示

《先秦诸子选读》是人教版高中语文选修教材之一。所选文章都具有极高的文学价值,同时也蕴藏着巨大的德育价值。本文侧重于论述后者,意在阐述挖掘和实现其德育价值的必要性和

期刊

先秦诸子选读德育价值实现

论《捉妖记》的融合式创作意识

2015年,国产魔幻大片《捉妖记》以24.38亿元人民币的票房成绩刷新了内地影史票房纪录,同时也创造了内地院线观影人次的最高纪录,其成功背后是好莱坞电影制作模式的本土化移植

期刊

《捉妖记》商业文化传统文化好莱坞融合式创作

基于Argo浮标的热带印度洋混合层深度季节变化研究

根据2004—2005年热带印度洋（30^oS以北）的Argo浮标（自持式海洋剖面观测浮标）温度-盐度剖面观测资料，采用位势密度判据（△σθ=0．03kg／m^3），针对每个Argo浮标的温度～盐度观测剖面确定了

期刊

Argo浮标混合层深度热带印度洋海-气相互作用

关于岳阳市水运企业的情况调查

一、岳阳市原有10家水运企业,到目前为止已破产了3家(临湘市水运公司、岳阳县水运公司、岳阳市郊水运公司),现在7家企业中,有中型企业3家(城陵矶港务局、岳阳市港务公司、岳

期刊

水运企业城陵矶港务局岳阳市港务公司

兰索拉唑对糜烂性胃炎患者血清干扰素γ、白细胞介素-4水平的影响

糜烂性胃炎分为急性和慢性两种。急性糜烂性胃炎约占上消化道出血的20%,是由各种病因引起的急性胃黏膜病变,其特征为胃黏膜多发性糜烂,伴有一过性浅表溃疡的发生及胃黏膜出血

期刊

糜烂性胃炎兰索拉唑血清干扰素γ白细胞介素-4

职业教育基地的定位与模式研究——以广州开发区为例

为应对经济快速发展、产业结构调整对职业教育发展需求提高的挑战,实现建设职业教育示范基地的目标,广州开发区职业教育未来发展应在空间、目标和功能方面进行科学定位,并建

期刊

职业教育示范基地定位模式广州开发区

当前我国金融风险的特点、成因及防范措施

期刊

金融风险防范和化解金融体制改革成因及防范信贷资金财政化信托业金融业央行监管预防性管理金融监管信贷风险

急性脑梗死患者凝血功能指标和D-二聚体变化研究

目的：探讨并发症及脑梗死面积对急性脑梗死（ACI）患者凝血功能指标及D‐二聚体（DD）水平的影响。方法收集249例ACI患者，检测其凝血功能指标及血浆DD水平，按不同并发症或梗死面积分组进

期刊

急性脑梗死凝血功能D-二聚体高血压糖尿病冠心病

带地下室结构高层建筑嵌固端选取问题探究

随着城市建筑向密集性、空间型发展,使得高层建筑在进行前期整体结构设计规划时,为了保证结构、造价、安全以及稳定性等综合性能,因此对嵌固端的位置选取就极为重要。本文以

期刊

高层结构嵌固端地下室结构空间刚度整体稳定性水平位移

基于Kriging代理模型的造斜率预测方法研究

造斜率受导向工具结构、类型、钻井参数、井眼轨迹、地层和钻头等因素的影响,构成了一个多变量影响的非线性耦合体系。造斜率预测呈现一定的模糊性、随机性和非线性特点,难以

期刊

Kriging代理模型造斜率预测方法预测性能多元回归模型径向基函数模型

面向微博的PageRank算法的改进与应用

其他学术论文