电商大数据推荐系统中逻辑回归算法的应用

来源 :科技信息·学术版 | 被引量 : 0次 | 上传用户:c42865
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:逻辑回归算法在电商中的应用非常普遍,他的操作简单,可行性高,满足大部分电商在商品销售时的一般需求,通过逻辑回归算法可以使电商很好地掌握用户的动态,抓住用户需求,很好地推荐自己的商品。
  关键词:电商;大数据;逻辑回归;算法应用
  随着互联网科技技术的迅速发展,人们获取信息的方法越来越方便,渐渐从信息缺乏时期进入了信息过载时期。在这个时期信息的生产者与消费者都遇到了前所未有的困难。信息生产者在竞争激烈的时代如何获取信息消费者的青睐成了最关键的问题,对于信息消费者来说,如何在众多的信息中找到自己最需要的也成为难点。特别是在电子商务领域,近年来电子商务发展迅猛,线上购物方式在人们的购物生活中占据很大的比例。国外有亚马逊、易趣、沃尔玛等;国内有淘宝、天猫、苏宁、京东等众多电商企业,他们都有自己一定量的客户群,而作为客户也不是就有一个电商平台,其中的竞争激烈程度可见一斑。所以在优胜劣汰的当下就需要电商拥有一套先进可行的系统,故推荐逻辑回归算法。
  一、电商大数据推荐系统中的算法种类
  (1)关联规则推荐算法
  所谓的关联规则算法,顾名思义是以相关联的规则为基础的推算方法。本方法的使用前提是客户已经购买某个商品,根据客户的購买情况,商品类别和其他商品相关联进行推荐。本方法简单易操作,能很好地满足零售业电商的需求,但是其要求客户必须在商家消费过并且有确切的商品种类、内容及时间,从而相互关联,这种算法也有一定的缺点,就是相关性的计算结果容易出现偏差,甚至与消费者的需求正好相反,所以,在使用时要反复校验,以确保信息的准确性。
  (2)协同过滤推荐算法
  协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是推荐和预测。算法通过对用户历史行为数据进行挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法,和基于物品的协同过滤算法。简单地说就是:物以类聚,人以群分。
  (3)逻辑回归推荐算法
  逻辑回归推荐算法是一种机械的学习,相较于其他的算法,更加简单,更加准确。因此,该算法在实际中得到了更广泛的应用。但是当该算法面对大量数据时,其工作量得到提高,工作效率就会下降。
  二、逻辑回归推荐算法的优缺点
  (1)优点
  1)实现简单,广泛的应用于工业问题上。
  2)分类时计算量非常小,速度很快,存储资源低。
  3)便利的观测样本概率分数
  4)对逻辑回归而言,多重共线性并不是问题,它可以结合   L2正则化来解决该问题。
  5)计算代价不高,易于理解和实践。
  (2)缺点
  1)当特征空间很大时,逻辑回归的性能不是很好。
  2)容易欠拟合,一般准确度不太高。
  3)不能很好的处理大量多累特征或变量。
  4)只能处理两分类问题,且必须线性可分。
  5)对于非线性特征,需要进行转换。
  三、逻辑回归推荐算法在电商推荐当中的主要应用
  (1)逻辑回归算法的判断标准
  逻辑回归算法在本质上属于线性结构,研究者在使用本算法时,应当利用客户的所有特征对算法进行训练,用户的各类特征组合是逻辑回归算法判断潜在客户和购买欲望的关键。逻辑回归算法在进行判断过程时,能够减少预测值范围,电商大数据推荐本来就属于二分类问题,就是客户的买与不买。在选定全面的数据后进行分析,通过数据解析出用户的不同特征及购买欲望,并存储解析出来的数据,判断用户是否进行购买。逻辑回归推荐算法判断简单,使用效果好,可以机械的学习,也可以基于大数据和用户特征进行自我训练。由于逻辑回归推荐算法需要的数据量过大,所以在运用时一般用其他的算法给与支持。
  (2)预测用户的复购行为
  在电子商务领域中,每天都有大量的用户进行购买或者复购,通过本算法可以对用户在最近一段时间内会不会复购做出预测。由于要根据用户最近的消费情况判断用户会不会在最近时期进行复购,研究者应根据用户半年内的浏览情况,购买情况,收藏情况等信息通过算法得出应该推荐的目标,再将目标记录到算法当中,来精准预测用户会不会复购。由于在机器学习领域,算法能达到的效果一般取决于数据与特征的准确性与数量,由此可以看出用户数据与特征在机械学习当中的重要意义。
  (3)选择用户特征 挑选优质客户
  用户每天都会进行大量的浏览甚至购买行为,通过机器学习,对客户的历史浏览、收藏、关注、购买等各类行为进行记录,还包括商品信息,如商品名称,商品价格,商品功能,商品的评价等,从而掌握用户信息,挑选优质客户。
  1)用户属性信息集合
  用户属性信息集合中储存了用户的所有信息,包括用户信息属性,姓名、性别、年龄、地址等;还包括用户数据信息,在购买、浏览的过程中产生的所有信息,包括用户的习惯性浏览、购物时间段,经常浏览的物品种类,浏览物品的时长,关注的店铺,收藏的店铺,购买的商品属性及购买能力;最后还包括了用户的手机型号,电脑品牌,运营商家等信息。通过以上系统储存,分析用户的各种信息,可以对用户的大概面貌进行绘画,得到用户画像。
  2)商品属性信息集合
  商品属性信息中包括了商品的厂家、商品名称、商品用途、商品价格、商品的购买次数、商品的评论等信息。
  3)用户属性信息和商品属性信息交叉属性信息
  用户属性和商品属性信息交叉属性中存储了用户信息和商品信息的共同特征,如用户的年龄与商品的种类的交叉,比如中老年人会购买家庭用品和养护用品,用户的性别与商品种类的交叉,比如女性用户会经常购买化妆品和护理产品,用户购买力与商品种类的交叉,比如学生会购买学习用品及自己的生活用品,用户的收藏爱好与商品种类的交叉,利用这些用户与商品的交叉信息向用户推荐产品,对产品进行优化,会具有更好的针对性,最终使不同的人成为不同的商品的忠实用户。   (4)将备选商品推荐给潜在客户
  通过逻辑回归算法对客户,商品进行整理、存储,从而得到精确的客户需求,实现这个过程基于大数据的模拟训练,具体的模拟训练需要经过下面三个步骤。
  1)模拟曝光步骤
  所谓曝光,就是用户在浏览过程中的动作,该用户在浏览什么商品,关注什么商品,购买了一些什么商品,那么系统就将与用户所浏览购买的商品的同类商品曝光在用户面前,对于这些推荐的商品如果用户已经收藏关注该店铺,那么这类商品就是正向样本,如果系统向用户推荐的商品没有在用户的关注收藏列表,那么该类商品就是反向样本。目前,系统一般只能识别正向样本,不能识别反向样本,降低了系统的准确性,所以应采用算法改善或者几种算法协同应用来弥补这种缺陷,使系统对用户推荐商品具有更高的准确性与可靠性。
  2)统计点击通过率
  点击通过率即用户的实际点击次数除以商品的总浏览量。在算法推荐应用中有很多种统计点击率的方法,其中最多使用的有以下几种:以性别统计的点击率,比如女性用户相比于男性用户更多地是购买衣服、化妆品、首饰等,所以她们更多地是浏览这些商品,系统就应该对这种点击率的用戶认定为女性用户,并向她们推荐一些女性用品,但产品一定不要局限于其浏览和关注收藏的商品,还要推荐一些厨房用品等;以年龄统计的点击率,比如年轻男女浏览的大部分都是一些当下比较潮流的东西,比如电子产品、时尚服装等,系统就可以将其定性为年轻群体,针对她们的喜好推荐一些商品,如手机、相机、潮流服饰等。经常浏览老年护理产品或者中老年服装的,系统就定性为老年人,并向其推荐老年人经常用到的商品;还有就是以购买力统计的点击率,这种主要就是通过用户浏览、收藏、关注的商品的价格高低来分辨的,如果经常;浏览,购买贵重物品,如金银首饰,珠宝,汽车用品等,这类就定性为高消费群体,为这类用户推荐商品就需要推荐一些高价物品,无论是衣服、鞋帽,还是生活用品,都要选择高端商品推荐。
  3)联合用户商品特性综合分析
  所有用户都有自己的喜好,他们年龄不同,性别不同,高矮胖瘦不同,生活起居不同,所以通过系统对用户性别、年龄、身高、体重、爱好等进行存储整理,结合各类商家商品的厂家,商品的用途,商品的价格,商品的规格进行综合分析训练,得出用户的精准需求,向用户定向推荐商品。
  随着大数据时代的到来,给这个时代带来了无限可能,同时也给我们带来了很多问题。信息网络的“信息过载”问题就是其中的一个难题,为了解决这个问题,推荐系统应运而生。本文介绍了现在在电商中应用比较广泛的推荐系统中的逻辑回归算法,通过对算法的分析,得出了本算法的优缺点,并给出了合理性的改进措施,希望大家能在这篇文章中学到一些东西。
  参考文献:
  [1]刘洁.电商大数据推荐系统中逻辑回归算法的应用[J].电子技术与软件工程,2021(18):154-155.
  [2]王鹏越.基于逻辑回归的电商评论文本分析模型[J].数码世界,2020(04):60.
  [3]刘海鸥,张亚明,苏妍嫄.大数据应用的理性回归[J].企业管理,2020(02):51-53.
其他文献
摘要:鱼皮画是赫哲族特有的艺术品,其独特的形式,从不同角度表现了赫哲族人民的聪明才智和审美,蕴涵独到的中华民族艺术美感。在二零零六年,鱼皮画被列入国家级非物质文化遗产名列。随着时代发展,鱼皮画融入了现代的艺术元素,具有了全新的艺术形式和更加丰富的文化内涵,同时也迎来了新的发展契机。文章对赫哲族鱼皮画的背景、发展前景、对外传播以及推广模式等方面展开了介绍,促进传播多样化,探索发展新模式。  关键词:
期刊
摘要:生态环境保护近年来成为了人们广泛关注的重点话题内容,生态恶化速度的不断提升,促使人们的生活环境逐渐处于岌岌可危的边缘地带,人类如果不能对生态环境加以保护,则会导致在未来的社会进程当中危害人类的健康生活,因此,加强生态保护必须能够构建环境监测与环境监察工作的联动实施,才能够保障生态环境得到保护。  关键词:环境监测;环境监察;生态保护;联动  引言:  基于社会经济的进程不断前进,促使在经济不
期刊
摘要:Excel是一个专门用于办公处理数据的软件,在各种领域的工作中,可以为各种数据进行分析和处理,并且将这些数据转化为清晰明了的表格。Excel简化了办公自动化的工作处理,使用多种数据处理让办公变得更加简单,提高了工作的效率,除了传统的Excel运用,还有许多适合工作的Excel运用的小技巧,可以运用在实际的工作中。  关键词:Excel;办公软件;运用技巧  引言:  Excel是一种由微软公
期刊
摘要:混合所有制职业院校非公有资本盈利不佳是阻碍其发展的一个重要原因,结合瑞士、德国、英国、美国等职业教育发达国家经验,提出强化社会责任感、摒除传统观念、政府大力支持、丰富回报形式等举措。  关键词:国外;非公有资本;盈利;混合所有制职院  国务院于2014年在《关于加快发展现代职业教育的决定》中提出要“探索发展混合所有制职业院校,允许以资本、知识、技术、管理等要素参与办学并享有相应权利”,首次在
期刊
摘要:伴随着我国经济的快速发展,基层政府的体制也得到了相应的改革,对于固定资产的投资统计工作要求也越来越高,然而当前我国固定资产投资统计工作开展仍有不足。本文主要针对基层政府固定资产投资统计所存在的问题进行分析,并探讨了基层政府固定资产投资统计常见问题的有效对策。希望能提高基层政府固定资产投资统计人员的专业素养和工作能力,健全投资统计管理制度,强化政府部门之间的团结协作,确保投资统计数据和信息真实
期刊
摘要:在现代社会,养宠已逐渐形成风气。但由于遗弃、丢失等各种原因而出现的流浪动物也在日益增多,且致人损害现象时有发生。目前,针对致人损害的流浪动物有出于好心对其进行暂时或长期投喂的人这一特殊情况,《民法典》对责任承担的规定尚存诸多不足之处,本文将对其进行分析、提出建议。  关键词:民法典 流浪动物 侵权责任  1引言  1.1研究背景  动物在人类生产生活中扮演着重要的角色。随着社会发展,如今诸多
期刊
摘要:立足于发挥政府引导作用、提高民众参与体育活动的意识,凸显小镇地域特色及特色运动休闲产业优势、增强体育小镇发展的竞争力,增加体育健康旅游养老等内涵产品供给、加快体育小镇基础设施建设等六方面,提出甘肃省体育小镇建设和发展的策略。  关键词:体育小镇;建设;发展;策略  一、发挥政府引导作用,提高民众参与体育活动的意识  发挥地方政府引导作用,统筹规划、建设、发展体育小镇,发展体育健身、体育休闲、
期刊
摘要:坚持建设社会主义法治体系;坚持依法治国、依法执政、依法行政共同推进,法治国家、法治政府、法治社会一体建设;坚持全面推进科学立法、严格执法、公正司法、全民守法是习近平法治思想的重要内容,这将进一步标志着我国的法治建设从静态的法治化体系想全过程、全主体、全层次的法治体系的全面提升。而法治思维在法治建设中的作用也将更加突出。本文就法治思维针对不同社会主体蕴含不同的思维及要求进行探讨,从而更好地培养
期刊
摘要:当我国传统的二十四节气和禅意插花艺术相融合时,插花艺术在具备中国传统特征的同时还能使传统的二十四节气满是花香。而当中国传统的二十四节气与室内插花艺术相融合时,便可大幅度提升室内装饰的文化艺术品位和设计成果,从而有效实现在实际生活中的“取之自然,用于自然,高于自然”的文化意境。另外,在对室内环境进行装饰设计时,也能通过我国传统的二十四节气中所蕴含的文化元素内涵去提升整个房屋的艺术品质,从而使我
期刊
摘要:兽医在动物疾病防治中发挥着重要的作用,需要加强自身专业技能和知识的学习,提前预防动物疾病问题,采取科学合理的措施来提高总体的防治效果。实际上,有些兽医因自身专业能力的欠缺,在动物疾病防治工作中会出现一些问题,影响动物疾病的诊断和治疗,不利于动物养殖业的长远发展。本文通过分析兽医在动物疾病防治中存在的问题,试探性提出几点优化措施,以便相关人士借鉴和参考。  关键词:动物疾病防治;兽医;问题;措
期刊