基于深度隐因子模型的推荐算法优化及可解释性研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:ffftty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,信息过载问题的重要性逐渐凸显并受到越来越多的关注。推荐系统通过用户的历史行为分析其需求偏好,从而帮助用户筛除冗余信息,提供个性化的推荐结果以缓解信息过载的问题。近年来,推荐系统已成为一个重要和热门的研究领域,并在各类媒体、娱乐、电子商务等互联网场景中得到了广泛的应用并产生深远的影响。推荐算法是推荐系统的核心,其主要原理在于通过收集用户历史行为中的正负反馈信息,为每个用户分别建模其个性化偏好,再以此为基础从海量的目标物品中筛选出用户最有可能需要的物品集合进行内容推送。推荐算法的技术路线经历了从经典的协同过滤算法到隐因子模型再到深度学习时代下的深度隐因子模型的变革。本文的主要研究问题是基于深度隐因子模型的推荐算法的优化及可解释性。目前的基于深度隐因子模型的推荐算法在隐式反馈及高阶交叉特征建模等典型场景中存在有一定的结构性问题,限制了模型的预测性能;另外,基于深度隐因子模型的推荐算法主要依赖于深度神经网络,考虑到神经网络是黑盒模型,其推荐结果往往难以给出直观的解释。本文基于深度隐因子模型,针对隐式反馈和高阶交叉特征建模场景的隐因子模型结构和隐因子模型的可解释性分析算法进行了研究与优化:首先针对隐式反馈下的协同过滤问题,设计了基于对偶嵌入向量的深度隐因子模型结构,以缓解负样本噪声和正样本稀疏对模型预测性能的影响;接着针对点击率预估中的高阶交叉特征建模问题,设计了基于任意阶交叉特征的自适应分解网模型,以解决高阶交叉特征建模中的阶数选择和特征筛选问题;最后引入了扰动函数分析技术,通过计算深度隐因子模型的训练数据对于其预测结果的扰动度,为模型推荐结果提供事后的可解释性分析。本文的研究成果包括:1.基于对偶嵌入向量的深度隐因子模型针对隐式反馈下的协同过滤问题,论文提出了基于对偶嵌入向量的深度隐因子模型。现有工作在隐式反馈下建模的用户和物品的原始嵌入向量在优化过程中容易受到负样本噪声和正样本稀疏的影响,进而损害模型的预测性能。论文设计了用户和物品的对偶嵌入向量表示,将每个用户(或物品)利用其历史交互物品(或用户)和注意力机制生成一个额外的嵌入向量表征以补充其原生嵌入向量的表示效果,并设计了两两配对的神经网络交互层进行对偶嵌入向量的交互建模及融合预测。另外,论文还将该模型架构拓展到了时序推荐场景,并验证了其对于时序推荐的适用性和有效性。2.基于任意阶交叉特征的深度隐因子模型针对点击率预估中的高阶交叉特征建模问题,论文提出了优化任意阶交叉特征的深度隐因子模型。现有的点击率预估模型常常通过构建显式的交叉特征以补充深度神经网络在复杂特征交互建模中的局限性。然而,其构建的显式交叉特征往往受到预定义的最高特征阶数所限制,因而只能在建模的特征阶数和计算复杂度之间进行权衡,同时还容易受到无关特征的干扰,难以达到最优的预测效果。论文设计了自适应分解网模型,通过引入对数神经转化层从训练数据中自适应地优化任意阶的交叉特征及其对应的权值,从而有效提升模型的特征建模和预测性能。3.基于扰动函数的隐因子模型可解释性分析隐因子模型如矩阵分解、神经协同过滤模型等相比传统的协同过滤算法往往能达到更好的预测精度,但却缺少模型的可解释性。现有工作大多通过引入辅助信息或修改限制模型结构以为隐因子模型的预测结果提供解释。论文提出一种基于扰动函数的事后分析方法,在不改变原有隐因子模型结构的基础上,通过扰动函数计算训练数据对于一个已训练的隐因子模型的预测影响,从而为其推荐结果在历史用户-物品交互记录中找到相应的解释。论文还利用了隐因子模型结构简化了扰动函数的计算过程以显著减少了总体计算的时间复杂度。论文在多个公开数据集上对所提出的算法进行了实验,实验结果说明了所提出的基于对偶嵌入向量的深度隐因子模型和基于任意阶交叉特征的自适应分解网模型相比现有的对比方法的优势,并验证了扰动函数分析方法解释结果的有效性。相关研究成果对于基于深度隐因子模型的推荐算法的设计具有一定的指导意义。
其他文献
朝鲜半岛属于汉字文化圈,汉语对韩国的语言文字产生过重要的影响。随着中韩交流的日益加深,语言在其中扮演了重要的角色。从亲属关系上划分,汉语属于汉藏语系,大多数学者都认为韩语属于阿尔泰语系,语系的不同就表明汉语和韩语在语法上有很大的差异。本文就语法方面谈谈汉语与韩语的不同。
地下结构的IDA分析有限元模型中包含土体与结构两个部分,三维模型可以同时考虑到土体与结构的非线性,但由于计算时间长、占用较大计算内存并不适用于IDA分析,因此需要对有限元模型进行简化。本文采用等效线性化方法计算土层的地震反应,利用单轴滞回本构模型PQ-Fiber来考虑结构的非线性,将三维土-结构模型简化为二维横断面模型,并将该简化方法在ABAQUS软件中实现。以大开地铁车站为研究对象的横断面地震分
吴冠中是我国著名的艺术大师、美术家、教育家,深耕于中国绘画领域,致力于将国外的油画和我国的山水画进行深度结合,将油画本土化和民族化,带领中国传统绘画走向世界,是我国现代艺术的领军人物之一。吴冠中精彩的绘画生涯中,始终坚持中西贯通的创作理念,将中国的民族特色、西方的艺术表达融入绘画作品之中,在其艺术生涯中创作了非常多的优秀艺术作品。本文以油画风景作品《双燕》为例,探讨其中的艺术美与民族特色。
在五育并举全面育人的教育理念中,劳动教育是重要的组成部分,在小学时期开展劳动教育能够培养学生良好的生活习惯,树立起正确的劳动态度,迎合新时代社会主义建设思想。在当前农村小学的教育中,存在着重智育,轻德育的现象,农村地区的教育发展不均衡,师资力量薄弱,条件受到限制,因此应该因材施教优化劳动教育,论文提出以下几个方面的劳动教育策略,旨在促进农村小学生的全面发展。
针对兴趣偏向度识别准确率较低,推荐过程稳定性较差的问题,提出语言识别下的数据库信息个性化推荐算法。利用数据库的内部信息分析附属资源连接点,对数据库进行分类标签,确定待推荐标签,利用余弦值计算数据频率,通过匹配信息实现聚类分析,计算兴趣偏向度,得到个性推荐化特点;基于语音识别技术,分层分析数据库信息概念,研究数据库内信息概念关系隶属,经过数据筛选、数据分析、数据输出完成识别过程。实验结果表明,该算法
近年来,随着高校的不断扩招,大学生数量明显增加,毕业生面临的就业压力与日俱增。在此背景下,做好大学生的就业指导工作显得尤为重要。职业生涯规划是大学生对未来职业生涯的自主规划,也是大学生就业指南的重要组成部分,对提高就业指导工作的质量具有重要的作用。文章从现阶段高校就业指导工作中存在的问题出发,分析了职业生涯规划在就业指导工作中的作用,并提出了促进职业生涯规划在大学生就业指导工作中有效应用的策略。
<正>新时代劳动教育是实现素质教育的重要载体,其内涵更丰富,具有显著的实践性和思想性。我校依托课题研究和劳动实践基地的开发,探究新时代劳动教育的实践路径,开展多种形式的劳动教育,让学生参与实践,提高学生的劳动素养,帮助学生更好地成长和生活。一、新时代劳动教育的定义与价值劳动教育是以培养学生劳动精神和品质,提高劳动技能和综合素质,培养劳动情感和劳动习惯为主要目的,通过劳动实践,发挥育人功能,
期刊
教师是文化和文明的传递者,其道德思想境界和文化素养对社会发展而言有着重要作用,教师不仅承担着教授学生知识的社会责任,而且还需培养自身文化素养,提高个人品格。教师具备一定品德素养,首先需热爱教育事业,尊重学生,具备社会责任感,只有满足这些基本条件,才能在后续教学活动中体现出自身的作用,提高学生学习质量,更好地教育学生。文章根据小学语文教师文化素养提升实际情况,针对其中存在的问题提出改进措施。
随着新课程改革的发展及素质教育的实施,现阶段的小学学科教学过程中越来越重视学生综合素质的培养。农村小学一直以来由于教育教学水平的限制,在教学质量及学习科目等方面存在一定的滞后性。开展有效的教学模式显得尤为重要,在农村小学开展书法教学显得尤为必要,为了分析农村小学有效开展书法教学的策略,针对现阶段农村小学书法教学现状进行了分析。