基于多任务学习的微博流行度预测

来源 :河南大学学报(自然科学版) | 被引量 : 0次 | 上传用户:jerry1121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以短文本内容发布为主要特点的微博,已经成为重要的信息传播媒介,预测微博流行度对舆情监测、企业营销、热点推送等都具有重要意义.当前对微博流行度预测的研究主要侧重于对所有用户的微博数据进行统一建模预测,鲜有研究考虑不同影响力用户之间的差异.而微博数据的分析显示标签、提及和微博长度等对微博流行度的影响会随发布者的影响力变化显示出明显差异,在流行度预测中充分考虑这些差异,有助于取得更好的预测结果.为此,在流行度预测中引入多任务学习(Multi-Task Learning,简称MTL),并结合SVM构建SVM+MTL模型,此模型通过同时考虑所有用户的共同特性和不同用户的具体特性来提高预测性能.此外,除了预测常用的用户属性和微博发布行为等特征外,还引入微博内容相似性这一新特征,该特征能明显提高预测准确率.基于微博数据的实验表明,SVM+MTL模型可以有效提高微博流行度预测性能. Weibo, which has the short text content as its main feature, has become an important information media, and it is of great significance to predict the popularity of Weibo to public opinion monitoring, corporate marketing, hot push, etc. The current research on the prediction of the popularity of Weibo Focusing on the unified modeling and forecasting of all the users’ microblogging data and few studies considering the differences among users with different influences.An analysis of the microblogging data shows that the tagging, mentions, The impact will vary significantly with the publisher’s influence, and taking these differences into account in predicting the prevalence will help to achieve better predictions. To this end, Multi-Task Learning (MTL for short), combined with SVM to build SVM + MTL model, this model by considering all the common characteristics of all users and the specific characteristics of different users to improve the predictive performance.In addition, in addition to predicting common user attributes and microblogging release behavior Features, but also the introduction of the new features of the similarity of the content of the microblogging, which can significantly improve the prediction accuracy.Experiments based on Weibo data show that the SVM + MTL model To improve the popularity of microblogging to predict performance.
其他文献
一个剧团.需要几名“角儿”挂牌.一所院校,需要多位“大师”坐镇。同样,一张报纸,一套节目,也需要一批“腕儿”支撑。当前,大众传媒不仅受到市场经济的激烈竞争.而且还面临新兴媒体的
随着科技的进步和信息化时代的到来,建筑行业赢得了越来越快速的发展。建筑施工作为工程中重要的一环,起着决定性的作用,所以提高建筑工程施工技术的管理有利于建筑行业的发
工程造价,对于建筑工程来说,可以控制其建设的成本,影响建筑质量。在建筑工程的管理项目中,工程的造价管理是一项重要的项目,由于建筑工程自身的特点,具有建设周期长,工程量
2008年1月中旬以来,中国华东、华中、华南、西南等地区遭受了多年罕见的低温雨雪天气,严重影响当地群众的生产生活和春运工作。受雨雪天气影响,部分省移动通信大面积中断,固定通
为改善随机极性的连续相应的扩展二元相移键控(CP-EBPSK)调制信号的频谱结构,该文提出一种带功率谱形状调节系数的随机极性修正CP-EBPSK(Modified CP-EBPSK,MCP-EBPSK)调制解调器。阐述了随机极性MCP-EBPSK调制的基本原理,给出了无随机极性的MCP-EBPSK调制理论功率谱表达式。同时,设计了合适的数字冲击滤波器用于解调,给出了无编码的随机极性MCP-EBPS
2014年的跨越式增长到2016年的平稳过渡,再到2018年的快节奏奔跑,在女性厨电领域,好太太电器在三四级市场通过数以百计的专卖店树起品牌旗帜。在专业厨电领域,能够将产品、品牌和
7月21日.走过14个年头的中国互联网大会再次拥抱了到场的热情观众。经过了中间的起伏波折.互联网大会已成为具有前瞻性的行业发展风向标。
英国电信(BT)近日与清华大学经济管理学院签署合作谅解备忘录,双方将继续在技术研发和人才培养等方面展开合作,合作领域涉及新技术、新媒体、新兴行业以及工业化进程等多个领域,同
人们对常用的词语反而容易不深究精确含义.两个原因.一是用的地方多,二是用得太顺口。“大数据”缘何称大.原来是指“扩大“的大.要把数据一词指涉的范围扩大。从按字段一条一条存
工业厂房的屋面防水工程是一项系统性工程,在防水工程施工中应严格按照设计和规范要求施工,加强管理和质量控制,本文主要结合工程实例对工厂屋面防水工程的主要做法进行阐述,