基于深度学习的推荐算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:cczzss1122334455
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的普及促进了网络通信,网络购物,网络观影,网络书籍等领域的高速发展。电子小说作为网络书籍的一种,不仅种类繁多,总量庞大,而且更新快,受众广,用户往往难以从大量的网络小说中迅速获取到感兴趣且高质量的内容。因此对于一个小说网站来说,若是能从海量书籍中为每位用户筛选出符合该用户兴趣偏好的书籍列表,便既能节约用户时间、提高用户体验,又能为小说网站增加用户黏度、提高网站收益,可谓是个双赢的过程。推荐算法已在很多领域得到研究和应用,但在电子小说领域的研究还很少。同时,随着用户、小说数量的快速增长,小说推荐系统对推荐算法的要求也越来越高。已有的小说推荐算法往往很少考虑到网络小说及其系统用户的特性,并且在准确性,运算效率,以及处理评分数据稀疏问题等方面都存在着较大的不足。深度学习技术近年来在很多领域取得了很好的效果,将深度学习引入推荐算法也是大势所趋。而已有的基于深度学习的推荐算法还有很大的研究空间,例如如何多角度的利用用户和物品信息,如何提高可解释性等。针对以上分析,本文的研究工作主要针对以下几点展开:1.针对评分数据稀疏日趋严重的问题,提出使用评论信息来弥补评分稀疏的方法。本文将深度学习算法和概率矩阵分解算法结合的混合推荐算法应用在电子小说推荐中,从而克服单一算法的缺陷。其中深度学习算法利用用户和小说的评论信息提取出用户评论特征和小说评论特征向量,概率矩阵分解算法则利用评分信息,通过最大后验估计得到用户和小说的潜在特征向量,最终利用用户和小说的潜在特征和评论特征对评分进行拟合。2.针对用户评论质量参差不齐的问题,提出高质量的评论有助于提升推荐算法效果,而低质量的评论是无意义的,甚至会削弱推荐效果的猜测。为了验证评论质量对小说推荐算法性能的影响,本文将注意力机制引入到卷积神经网络中。通过注意力网络给不同质量的评论文本分配不同权重,验证了猜想。不仅更加有效的利用了评论信息,同时提高了模型的准确性和可解释性。3.实验设置上,使用了Kindle_Store_5公开数据集和豆瓣小说真实数据集,首先对豆瓣小说真实数据集进行爬取,然后选取了概率矩阵分解算法(ProbabilityMatrix Factorization,PMF)、卷积矩阵分解算法(Convolutional Matrix Factorization,Conv MF)、深度协同神经网络算法(Deep Cooperative Neural Networks,Deep Co NN)这三种典型的推荐算法与本文算法一同进行测试并对比。实验结果显示,本文算法整体性能优于其它算法,在稀疏的数据集上表现也相对较好;实验同时对比了引入注意力机制的模型和没有引入注意力机制的模型测试结果,验证了评论信息的质量对算法性能的影响;通过分析模型计算出的评论的权重分数,验证了本文算法的可解释性。4.以Spark大数据计算平台为依托,基于本文提出的算法,设计并实现了一个小说推荐系统,包含每日推荐,热门推荐,实时推荐,用户检索等功能,通过对系统进行功能和性能测试,该系统基本满足预设要求,具有一定的实际应用价值。
其他文献
提出了基于扬声器目标传输函数的扬声器声音重放特性修正方法。给出了用于修正的逆滤波器的求解方法,并在逆滤波器求解过程中引入正则化因子以避免过大的修正。最后讨论了不
机电设备的安装维修是非常重要的,从设备、资料、运行等多个方面出发,提出针对大型水利泵站机电设备的安装和检修措施,让水泵安装技术、设备调试、质量控制管理等更加科学合
我国稠油资源丰富,对其进行降黏开采对于我国国民经济发展意义重大。目前常用的蒸汽驱、蒸汽吞吐、电加热等方法存在设备复杂、成本高、能量损耗大、安全性差等缺点,寻找新的
传统的教学理念已经落后,很难适应现在的需求,教材正在被“教材教学”的理念所取代,教材的二次发展已成为必然趋势。特别是教材的二次开发是教材改革的要求。在新的教材管理体制下,教材的功能也发生了相应的变化。因此,教材建设是每个教师都要面对的问题。此外,素质教育理念也在国内被提了出来并逐步得到了全面践行,教材建设日趋完善,并在此方面付出了巨大努力你好。各种版本的小学英语教材琳琅满目,然而,这些教材是国家制
这款吸尘器在清洁喷嘴上安装了一个摄像头,手柄上面则设置有配套的显示器,让你可以看到沙发,地毯和其他难以看到的地方下面堆积的垃圾,从而帮助您更好地清洁。
随着近年来大众经济水平的逐渐提升,也提升了大众的生活质量,同时大众也对生存环境引起了一定关注。当今社会的居住环境有着科学性,配套性和以人为本等特点,这些特点都对人居
为了适应我国经济的快速发展,国家铁道部提出了客货分离的高铁发展战略,规划布局了八纵八横的高铁网络,目前已经完成四纵四横网络的建设,正在延伸加密。随着高铁网络的不断完
研究背景:Sirtuin 2(SIRT2)是NAD~+依赖的去乙酰化酶Sirtuin家族中的一员。近年来的研究证实SIRT2抑制可以有效治疗神经退行性疾病。但是,目前为止,SIRT2在创伤性脑损伤(TBI)
普惠金融不只是金融理念的简单扩充,它代表金融服务由量变到质变的过程。2018年党的十九大报告中提出要以实体经济作为发展的着力点,普惠金融致力于为社会所有群体尤其是传统金融服务所覆盖不到的弱势群体提供金融服务,是提高实体企业融资效率的有效途径。发展普惠金融是缩小贫富差距、促进经济发展、全面建成小康社会的必然要求。本文从以下五个方面对普惠金融发展的空间关联网络及驱动因素进行研究:第一部分介绍普惠金融的
抗战时期李长之围绕着“中国的文艺复兴”这一命题展开了一系列的论述,本文将之命名为“文艺复兴论”,而《迎中国的文艺复兴》乃是体现这一思想的核心文本。本文试图分析李长