基于主题模型和多任务学习的微博个性化推荐算法研究

来源 :广州大学 | 被引量 : 0次 | 上传用户:jasmineonbridges
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,互联网技术逐年发展,步步攀升,社交平台也随之迅速发展,其中,新浪微博是目前热度排行榜上第一位的一个社交平台,但随着越来越多的用户涌入新浪微博,微博数据日益攀升,不断更迭,用户很难在海量信息中精准捕捉到自己最感兴趣的内容和最需要的讯息,这时就需要在微博中应用个性化推荐来解决信息过载的问题,从而增强用户体验。本文主要通过用户微博文档挖掘用户兴趣、构建完善的用户兴趣,再利用多任务学习模型为用户推荐最符合用户兴趣要求的前N条微博,全文的主要工作大致可以分为以下几点:(1)本文提出了一个基于主题模型LDA的微博用户兴趣衰减模型。该模型提取了原创微博和非原创微博中隐藏的用户兴趣,并将二者进行融合,完善了用户兴趣组成,更加全面精确地挖掘用户兴趣。此外,该模型考虑时间因素,描述用户兴趣演变过程,体现了用户兴趣随时间的衰减性。该模型相比于传统的LDA模型能更好地挖掘用户兴趣,为下一步的推荐打好基础。(2)本文提出一个基于多任务学习的用户兴趣度预测模型。本文将用户转发,点赞以及评论某条微博的概率按照不同的权重进行融合,所得到的值定义为用户对该条微博的兴趣度,该模型同时完成转发率、点赞率和评论率的预测进而得到兴趣度。兴趣度反映了用户对某条微博的感兴趣程度,为后续微博推荐提供了依据。(3)本文提出了一个将用户兴趣衰减模型与用户兴趣度预测模型结合起来用于微博内容的个性化推荐算法。用户兴趣衰减模型的输出作为用户兴趣度预测模型的输入特征,由此将两个模型结合起来,进而完成对用户兴趣度的预测,最后按兴趣程度大小进行排序,兴趣度高的前N条微博被推荐给用户。该模型能精准挖掘用户兴趣,相比于传统的基于微博内容的推荐能更好地提供个性化推荐服务。通过本文研究,可以帮助用户筛选出自己最想阅读的微博内容,获取用户最需要的微博信息,解决微博内容推荐结果过于单一不能满足用户个性化需求的问题,增强了用户体验。
其他文献
区块链是一种点对点的分布式数据库,具有匿名化、防止篡改和去中心化等优势,已成为国家发展下一代信息基础设施的关键要素和数字经济的核心构件。它依存于互联网生态环境,一方面能提供可信任的基础协议,在金融服务、医疗健康、电子政务等领域,具有巨大的应用潜力;另一方面,能与各种前沿信息技术融合,对重塑数字经济发展生态具有重要的意义。因此,开展区块链技术的基础应用研究具有重要的科研价值和显著的应用意义。区块链作
森林火灾的发生对经济、生态环境等会产生巨大影响。全世界每年有数十万次的森林火灾发生,严重危害着地球的生态资源和人类的生存发展。因此森林火灾的监测预警技术,已经成为当今世界各国都十分关注的研究课题。视频图像型森林火灾检测的难点在于,目前的技术手段主要是传统的图像检测方法,即人工提取特征,再训练分类器进行识别。鉴于森林坏境比较复杂,导致算法准确率低,鲁棒性不强并且适用性较差。针对现有问题,本文进行了深
以NaYF4为基质的稀土上转换发光材料具有发光背景低、化学性质稳定、抗光漂白、生物毒性小和生物相容性好等优点,已经在生物分子检测、细胞成像、光动力学治疗等领域得到研究和应用。近年来,为提高上转换纳米粒子作为光学探针用于分析测定的灵敏度,如何进一步提高纳米粒子的发光强度是许多科研工作者关注的问题。基于以上研究背景,本实验系统地研究了非稀土离子掺杂对NaYF4:Yb,Tm纳米粒子发光性能的影响,并对纳
随着社会发展和人类生活水平的提高,人类对生命健康的关注越来越多,对重大疾病标志物的检测要求越来越高。重大疾病标志物的高灵敏检测不仅对疾病的早期诊断有重大意义,而且可以帮助临床医生采取最好的治疗措施。一些疾病标志物在细胞、血液或体液中的含量水平非常低,这在一定程度上影响了疾病的早期诊断和治疗。因此发展高灵敏、高选择性的检测分析方法尤为重要。电化学传感器尤其是电化学核酸适配体传感器因其特异性和灵敏度高
近年来研究发现,硫化氢(hydrogen sulfide,H2S)作为继CO、NO后第三种气体信号分子,在动物和植物体内均发挥重要的生理功能。而在生理状态下H2S的主要存在形式为HS-,即HS-作为H2S的共轭碱大量存在于生物体中。H2S本身是一种高亲脂性的分子,容易穿过细胞的磷脂双分子层,但HS-需要介导物质。在对细菌、动物等的HS-转运机制研究中,均发现了相应的HS-转运蛋白,但在植物领域目前
随着人工智能技术的快速发展和广泛应用,人工智能技术在带给人们生活便利的同时也带来了越来越多的安全性问题,其中,对抗样本的安全性就是最典型的问题之一。对抗样本通过在良性样本上添加微小扰动或随机噪声,导致深度神经网络模型给出错误的预测结果,进而造成系统模型的决策错误。因此,如何在对抗样本的攻击下,保证深度学习模型高效、稳定的工作是一个非常具有现实意义的研究方向。在本篇论文中,我们首先对人工智能领域的机
工业控制系统(Industrial Control System,ICS)内控制信息和状态信息都需要工控协议进行传输。工业控制协议中存在很多厂商自己定义的私有工控协议,且私有工控协议的使用越来越广泛。然而,私有工控协议很少公开协议规范,并且设计上欠缺考虑安全性,存在隐藏的安全问题,研究工控私有协议的安全性需要了解协议规范,而协议逆向工程则是挖掘其协议规范的有效解决方案。本文整体目标是提取私有工控协
近十年以来随着科学技术发展,通信技术得到了快速的成长,特别是第五代通信网络(5G)成为重点发展方向,移动设备的地位变得尤为重要。移动设备已经从单一的通信设备发展为现在的具有一定计算能力,而且可以处理多种任务的智能终端。但是,移动设备的由于其体积限制,计算能力不仅受到了限制,而且最近几年电池技术停滞不前,导致移动设备的可以执行的任务受到了严重限制。为了解决这个问题,人们开始考虑将计算任务卸载到云服务
表皮是昆虫抵御外界环境的第一道屏障,表皮表面有大量微生物附着,昆虫在长期进化过程中与微生物形成了复杂的共生关系,使昆虫拥有更强的适应能力。然而,昆虫表皮微生物尚缺乏系统研究。飞蝗是重要的农业害虫,主要危害禾本科植物类重要的农作物,造成作物产量巨大损失。而关于蝗虫表皮菌群结构组成和群落多样性的研究很少。本文以飞蝗(Locusta migratoria)为研究对象,采用宏基因组高通量测序技术和传统分离
激光雷达测量技术是在上个世纪中叶逐渐发展起来的一种先进的测量技术。激光雷达根据雷达组成配件的不同,可以分为机械式激光雷达和MEMS(微机电系统)激光雷达系统。无论哪种测量系统,原理上都是通过发射高重复频率的激光脉冲和捕获返回信号,来获得被测目标的位置信息。MEMS激光雷达技术,采取巧妙的方式集成了传统激光雷达的零部件,使得机器更加紧凑,具有低成本、易量产、轻量级等优势,便于搭载于高精精密设备中,具