基于深度学习的论文推荐模型与应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:yongqiangdd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着学术成果的蓬勃发展,学术论文大量涌现,如何从最新的学术论文中挑选出自己感兴趣的学术论文,成为科研人员亟待解决的难题之一。传统的学术推荐系统面临着如下三个问题:(1)需要人工构造大量特征,定义复杂,依赖领域知识,可复用性差;(2)特征高维稀疏,通常采用精确匹配的方式,丢失了语义层面的匹配信息;(3)通常推荐固定数量的论文给用户。针对以上这些问题,本论文提出一种新的基于深度学习的个性化学术论文推荐模型,解决了人工构造特征工作量大,并且丢失了语义匹配信息的问题,在此之上,提出了一种联合学习方法,实现了根据用户和论文的匹配程度以及用户偏好,动态的决定推荐论文的数量。最后将模型进行部署与应用,搭建了论文推荐引擎,开发了智能学术助手Acad.Bot,验证了模型的有效性。论文的具体研究工作如下:  为了解决人工构造特征,工作量大,并且丢失了语义层面匹配信息的问题,论文提出了一种基于隐式反馈的扩展的卷积深度语义匹配论文推荐模型ECDSSM。该模型有如下几个优点:首先,该模型能够自动学习特征,避免了人工构造特征的代价。其次,该模型能够学习用户和论文的分布式语义表达,将用户和论文同时映射到同一个低维的语义空间计算相似度,实现语义层面的匹配。最后,模型是以排序为目标的端到端的有监督算法。通过实验证明,与其他模型相比,我们的模型效果最好,例如与基于人工构造特征的排序学习推荐算法相比,在效果上模型的NDCG提升了11.3%。  为了能够根据候选论文和用户的匹配程度以及不同的用户偏好,动态的推荐不同数量的论文。论文提出了一种联合学习框架,实现推荐数量的动态化。并且,论文把这个框架应用在我们提出的深度学习推荐模型上,扩展成了动态的深度学习推荐模型。线下实验结果表明推荐的F1-score比原来的模型提升26.7%,线上实验结果表明动态的深度学习推荐模型比原来模型的效用提升38.4%。  最后,为了满足用户对学术推荐的需求,论文将模型进行部署与应用,搭建了学术论文推荐引擎,开发了智能学术助手Acad.Bot。Acad.Bot能够自动收集用户信息和论文信息,每天给用户推送arXiv上最新发布的符合用户兴趣的K篇论文,并且能够根据用户的反馈日志更新用户的语义表示,提高推荐效果,形成有效的闭环。通过将论文提出的推荐模型应用到Acad.Bot中,验证了模型的有效性、可用性与智能性。
其他文献
第三代搜索引擎有如下几个特点:索引数据库的规模继续增大,一般的商业搜索引擎都保持在几千万甚至几十亿个网页;由于搜索返回数据量过大,检索结果相关度评价成为研究的焦点.
该文采用虚拟现实的行为建模方法,在对可编程实验环境的操作过程分析的基础上建立基于软硬件协同处理环境的SHCB(SoftwareHardwareCooperation Behavior)模型.SHCB模型以虚拟
近年来,在自然语言处理领域中,相比于分词、词性标注、命名实体识别等浅层自然语言理解任务,句法分析等深层自然语言理解任务越来越受到关注。句法分析就是分析一个给定句子的内
IPSec/VPN安全策略管理原型系统(SPMS)较好地解决了IETF建议的安全策略系统(SPS)中存在的缺少策略一致性检查和策略自动调整机制等问题.它采用并扩展了DEN技术中的策略类信息
本文提出了基于数据仓库系统、模型库、知识库、OLAP、数据挖掘的新型电力负荷预测系统。本文对模型管理中模型集成进行了研究,提出了基于模型操纵的模型集成理论、模型集成中的误差理论、预测模型最优线性组合理论,相应解决了负荷预测中模型集成、模型集成的选择、预测模型最优线性组合等问题。 首先本文分析了负荷预测对模型管理提出的三个要求:一能灵活的进行负荷模型的组合计算,即有较强的模型集成功能;二能在多
IP组播是互联网上的一种群组通信技术,它的应用可以有效地节省网络带宽,避免网络拥塞的出现.IP组播的安全性已经成为一个迫切需要解决的问题.通过对IP组播的实现和安全性问题
个性化主动服务有覆盖推送、过滤推送和发布-订阅推送三种实现方式,其中发布.订阅推送方式能较好地满足用户的个性化要求,且实现简单,因此在PAS框架中采用了发布-订阅实现方
基于构件的软件开发的关键工作为构件的组装,而传统的构件组装未能很好地对B/S应用的开发进行支持.该文的重点在于如何把构件组装与B/S应用的开发进行结合,并提出了一个基于J
学位
实时操作系统中通常需要使用各种外部设备,并且要求对外部事件作出快速准确的响应,否则可能导致灾难性后果.此外嵌入式系统使用的设备种类繁多,往往需要用户自行编写相应的设