基于电商数据的推荐算法研究及应用

来源 :山东大学 | 被引量 : 0次 | 上传用户:gandianci20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网科技的发展,人们获取信息的方式越来越多,信息的数量爆炸式增长,内容的复杂度也不断提高,简单的信息检索技术已经无法满足大部分人的需求,并且我们的时代已经由物品匮乏的时代转化为了物品丰富的时代,随着物品数量和种类的增多,人们的注意力成为了稀缺资源。电子商务的确面临上述问题,如何在海量的数据中快速找到用户需要的物品变得非常重要,因此电商场景下的个性化推荐系统应运而生。目前电子商务迅猛发展,中国代表的有淘宝、京东、苏宁等等,其中包含了大量的用户和商品数据,对于大量的随机性数据,传统的推荐算法不能很好地对用户预购买商品进行预测。针对上述问题,我将推荐问题变换成分类问题,使用淘宝用户-商品数据集,对用户行为数据进行特征提取,再利用机器学习中的分类算法,对用户喜好的商品进行预测,实验结果发现强化学习中GBDT模型的F1分数比逻辑回归算法的F1分数提升了近一倍,GBDT算法在处理随机性较强的数据具有明显的优势,在电商推荐数据集上取得了很好地效果。由于电商场景下根据传统的推荐算法利用的是评分数据集,然而商品数据集中面临着评分数据缺失严重或没有评分数据问题,针对这个问题,本文通过在传统的推荐算法基础上,引入用户行为变量,在Jaccard相似度基础上,提出一种新的用户之间相似度计算方法和用户-商品得分计算方法,通过两者结合进行用户间的协同过滤推荐。通过在阿里的天池平台下载的淘宝用户行为和物品信息数据选取部分用户进行实验,实验结果F1分数值为0.154,并与传统协同过滤算法实验结果进行比较,F1分数有很大的提升。由此可以得出:新的用户相似度计算方法可以更有效的找到目标用户的近邻用户,从而提高推荐的准确率,而且新的相似度计算公式没有用到用户评分数据,所以在一定程度上解决了评分数据稀疏的问题。
其他文献
研究目的:有氧能力是耐力素质的基础,是运动员不可或缺的一项身体基本能力;同时也是耐力训练的一个重要组成部分。良好的有氧能力是运动员进行无氧大强度训练的前提和基础。
正在建立和完善的我国社会主义市场经济体制中的现代企业制度是建立企业伦理的一是要现实基础,产权明晰、权责明确,要求企业承担社会责任,企业伦理为之提供了重要的价值依据和导
随着我国社会保障事业进程的加快,社会保险覆盖面开始不断扩大,社会保险基金的征缴、支付范围和规模日趋增大,社会保险制度也需不断完善。仅从近年来全国各级审计机关披露的养老保险基金违规使用的审计结果来看,养老保险基金的支付管理业已成为社会普遍关注的焦点。城镇职工基本养老保险是社会保障事业一个重要组成部分,保险基金涉及金额最大,其中基金支付管理是广大城镇职工最为关注的,同时也是最容易出现问题的。毋庸讳言,
地源热泵技术也称地热泵技术,是一种利用地球表面浅层水源(如地下水、河流和湖泊)和常温土壤源中的能量及吸收的太阳能和地热能作为能源,借助热泵机组向建筑物内用户提供既可供
本文叙述有线电视的MMDS系统的工作原理、特点及应用。
本文阐述和分析了机械加工存在误差的主要原因,并提出了提高机械加工精度的具体措施。
本文主要介绍了在《模拟电子技术基础》课程教学中应用EWB(虚拟电子工作台)进行模拟实验的方法和一些实例。通过这些例子,我们可以看到EWB在《模拟电子技术基础》课程教学中的广
随着社会的发展和进步,历史课的教学方法需要改革。本文对激活历史课程教学的方法进行探讨。
针对低渗透油藏注水压力高,常规注水工艺技术无法完成配注要求的情况,本文着重介绍了江汉油田超高压注水工艺管柱的结构、工作原理,分析了超高压注水管柱的现场应用情况,对存在的
流动资产和流动负债是一种短期性的负债,应付票据是债务人在将来某一特定时间或某一特定时间之前支付给债权人一定金额的无条件书面承诺。予付费用是指已支付而由后期受益的