基于深度学习和Stacking集成策略的混合推荐算法研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:fongfongfongfong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐技术能够在用户缺乏确切的需求时,通过对用户以往的选购行为进行分析,创建用户喜好模型,挖掘物品的长尾,更好地给用户选出那些他们有兴趣但很难发现的物品,提高选购效率。由于深度学习和移动互联网计算技术的快速发展,网络中所存储的信息和数据已经呈指数性的增长。尽管用户产生的数据能够有助于推荐技术得到更有价值的信息,从而大大提升推荐算法的预测效果,但过多用户随意创建的标签数据会使推荐技术面临着数据的稀疏性、可扩展、冷启动、准确性、有效特征抽取困难等问题,导致用户的体验较差,推荐准确度也较低。本文分析了基于内容的推荐算法,概率矩阵分解和基于用户的推荐算法。在传统的推荐算法中,用户在项目上的评分矩阵越来越稀疏。协同过滤方法是应用范围最为广泛的推荐技术,采用简单的内积交互模型,只考虑单一的评分信息,存在冷启动问题并且无法学习到用户和项目之间错综复杂的非线性关系。然而基于内容的推荐算法具有个性化的优势,只能推荐出与用户过去浏览相似的物品,并遭遇有效特征提取的困难。而深度学习模型的特性可以学习到更复杂的结构,因此将深度学习技术与推荐算法融合解决上述问题成为了新的发展趋势。针对这一问题,提出一种基于深度学习和Stacking集成策略的混合推荐模型。利用Stacking集成策略对基于用户、概率矩阵分解、基于内容的推荐算法进行先融合,对多个模型的输出结果进行泛化,使各个算法之间可以优劣互补,突破单模型的瓶颈,从而达到更加出色的推荐性能。再基于融合后的模型通过深度学习技术捕获用户和项目之间更深层次和抽象的非线性交互关系,缓解数据的稀疏问题,使模型性能得到更进一步的攀升。使用Python编程,对算法进行验证。在MovieLens-100k、Movie Lens-1m和Pinterest数据集上与基于用户、概率矩阵分解和基于内容的传统推荐算法进行实验对比,结果表明所提出的混合推荐模型在测试数据集上的评分预测准确性有显著提升。
其他文献
张鹏翮(1649-1725),字运青,号宽宇,谥文端,四川遂宁人,康熙九年(1670)进士,官至宰相,是清代巴蜀地区卓有建树的文人、治河专家、政治家、教育家、书法家和外交家。他身跨顺治、康熙、雍正三朝,其活动轨迹主要在康熙朝,且目睹了康熙朝由统一走向鼎盛的过程。为官五十余载,张鹏翮先后担任二十余个重要职务,以清名著世,被康熙帝誉为“天下廉吏无出其右”,为有清一代268年间蜀人官位最显赫、政绩最卓著
前言2013年11月,十八届三中全会审议通过的《中共中央关于全面深化改革若干重大问题的决定》中明确提出,推进股票发行注册制改革。经过五年的筹备,2018年11月5日,习近平总书
会议
我国中风患者众多,其中70%-85%的患者伴有偏瘫。偏瘫患者上肢丧失活动能力后,如果不及时进行康复治疗,容易造成肌肉萎缩、关节僵化等问题。所以,患者需要借助康复治疗器材进行康复训练。脑机接口(BCI)指在人脑和计算机或其他电子设备之间建立一种不需要依赖外周神经系统和肌肉组织进行信息传输的人机交互系统。该系统可以直接将人体脑电信号(EEG)翻译成外部设备控制命令并支配外部设备进行运动。基于神经生理学
在烟气污染物排放标准不断加严下,以钢铁烧结和垃圾焚烧为代表的固定源烟气排放受到关注,其烟气排放呈现出两个共性特征:一是烟气温度低于300?C;二是烟气中含有二噁英类(PCDD/
黄土高原是我国四大高原之一,在东亚季风、黄土下伏地形等因素共同作用下,黄土高原成为世界上最为典型的沟壑侵蚀区之一,其中沟壑分布范围广,沟壑形态多样,是沟壑相关研究的重要研究区之一。沟壑是黄土高原最有活力、最具变化的地貌单元,沟壑在传递物质能量的同时,不同沟壑之间通过径流节点相互连接,在流域内部形成沟壑网络,控制着流域的地表形态。围绕黄土沟壑,前人已经做了大量的研究,近年来,随着遥感和地理信息科学等
股市指数的波动是证券投资者所关注的焦点内容,其影响因素涵盖诸多方面,有直接相关的影响因素和一些难以被察觉到的潜在因素。近年来,随着计算机运算能力的加强和众多人工智
近年来,中国陕北黄土高原因其较高的研究价值而受到学术界的广泛关注,已出现了数种黄土高原区域地貌分类方法。有些研究应用分形维数(FD)来描述该地区地貌特征,但是,并未见基
股票市场是一个很庞大的复杂系统,国内股票市场是比较复杂的,交易量和价格不稳定。近些年,股票市场交叉持股、相互投资合作的现象越来越多,这也加大了分析股票的难度。将股票进行聚类,从中发现股票之间的关系,有利于投资者们制定更加科学可靠的投资决策。谱聚类算法是建立在复杂网络理论之上的,其核心是将聚类问题转化为图的最优化问题。与传统的聚类方法相比,谱聚类能用于任意形状的数据且收敛于全局最优点。但该算法的一个
数字高程模型(Digital Elevation Model,DEM)作为现代数字地图4D产品的一部分,在地貌学、水文学及土壤学等领域具有广泛的应用。在黄土地貌区,地表形态易在短时间内受暴雨侵蚀和人类活动等外力作用影响,使得区域内高精度DEM数据的快速与准确获取是黄土高原数字地形分析与应用研究的重要基础。无人机(Unmanned Aerial Vehicle,UAV)摄影测量在短时间内可获取海量点
雷锋精神是新中国建设时期的主要精神支柱,承载着中国共产党人的初心和使命,也是新时代激励全国人民永远奋斗的红色精神。雷锋精神的丰富发展历程自1963年毛泽东同志为雷锋题