论文部分内容阅读
摘要:逻辑回归算法在电商中的应用非常普遍,他的操作简单,可行性高,满足大部分电商在商品销售时的一般需求,通过逻辑回归算法可以使电商很好地掌握用户的动态,抓住用户需求,很好地推荐自己的商品。
关键词:电商;大数据;逻辑回归;算法应用
随着互联网科技技术的迅速发展,人们获取信息的方法越来越方便,渐渐从信息缺乏时期进入了信息过载时期。在这个时期信息的生产者与消费者都遇到了前所未有的困难。信息生产者在竞争激烈的时代如何获取信息消费者的青睐成了最关键的问题,对于信息消费者来说,如何在众多的信息中找到自己最需要的也成为难点。特别是在电子商务领域,近年来电子商务发展迅猛,线上购物方式在人们的购物生活中占据很大的比例。国外有亚马逊、易趣、沃尔玛等;国内有淘宝、天猫、苏宁、京东等众多电商企业,他们都有自己一定量的客户群,而作为客户也不是就有一个电商平台,其中的竞争激烈程度可见一斑。所以在优胜劣汰的当下就需要电商拥有一套先进可行的系统,故推荐逻辑回归算法。
一、电商大数据推荐系统中的算法种类
(1)关联规则推荐算法
所谓的关联规则算法,顾名思义是以相关联的规则为基础的推算方法。本方法的使用前提是客户已经购买某个商品,根据客户的購买情况,商品类别和其他商品相关联进行推荐。本方法简单易操作,能很好地满足零售业电商的需求,但是其要求客户必须在商家消费过并且有确切的商品种类、内容及时间,从而相互关联,这种算法也有一定的缺点,就是相关性的计算结果容易出现偏差,甚至与消费者的需求正好相反,所以,在使用时要反复校验,以确保信息的准确性。
(2)协同过滤推荐算法
协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是推荐和预测。算法通过对用户历史行为数据进行挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法,和基于物品的协同过滤算法。简单地说就是:物以类聚,人以群分。
(3)逻辑回归推荐算法
逻辑回归推荐算法是一种机械的学习,相较于其他的算法,更加简单,更加准确。因此,该算法在实际中得到了更广泛的应用。但是当该算法面对大量数据时,其工作量得到提高,工作效率就会下降。
二、逻辑回归推荐算法的优缺点
(1)优点
1)实现简单,广泛的应用于工业问题上。
2)分类时计算量非常小,速度很快,存储资源低。
3)便利的观测样本概率分数
4)对逻辑回归而言,多重共线性并不是问题,它可以结合 L2正则化来解决该问题。
5)计算代价不高,易于理解和实践。
(2)缺点
1)当特征空间很大时,逻辑回归的性能不是很好。
2)容易欠拟合,一般准确度不太高。
3)不能很好的处理大量多累特征或变量。
4)只能处理两分类问题,且必须线性可分。
5)对于非线性特征,需要进行转换。
三、逻辑回归推荐算法在电商推荐当中的主要应用
(1)逻辑回归算法的判断标准
逻辑回归算法在本质上属于线性结构,研究者在使用本算法时,应当利用客户的所有特征对算法进行训练,用户的各类特征组合是逻辑回归算法判断潜在客户和购买欲望的关键。逻辑回归算法在进行判断过程时,能够减少预测值范围,电商大数据推荐本来就属于二分类问题,就是客户的买与不买。在选定全面的数据后进行分析,通过数据解析出用户的不同特征及购买欲望,并存储解析出来的数据,判断用户是否进行购买。逻辑回归推荐算法判断简单,使用效果好,可以机械的学习,也可以基于大数据和用户特征进行自我训练。由于逻辑回归推荐算法需要的数据量过大,所以在运用时一般用其他的算法给与支持。
(2)预测用户的复购行为
在电子商务领域中,每天都有大量的用户进行购买或者复购,通过本算法可以对用户在最近一段时间内会不会复购做出预测。由于要根据用户最近的消费情况判断用户会不会在最近时期进行复购,研究者应根据用户半年内的浏览情况,购买情况,收藏情况等信息通过算法得出应该推荐的目标,再将目标记录到算法当中,来精准预测用户会不会复购。由于在机器学习领域,算法能达到的效果一般取决于数据与特征的准确性与数量,由此可以看出用户数据与特征在机械学习当中的重要意义。
(3)选择用户特征 挑选优质客户
用户每天都会进行大量的浏览甚至购买行为,通过机器学习,对客户的历史浏览、收藏、关注、购买等各类行为进行记录,还包括商品信息,如商品名称,商品价格,商品功能,商品的评价等,从而掌握用户信息,挑选优质客户。
1)用户属性信息集合
用户属性信息集合中储存了用户的所有信息,包括用户信息属性,姓名、性别、年龄、地址等;还包括用户数据信息,在购买、浏览的过程中产生的所有信息,包括用户的习惯性浏览、购物时间段,经常浏览的物品种类,浏览物品的时长,关注的店铺,收藏的店铺,购买的商品属性及购买能力;最后还包括了用户的手机型号,电脑品牌,运营商家等信息。通过以上系统储存,分析用户的各种信息,可以对用户的大概面貌进行绘画,得到用户画像。
2)商品属性信息集合
商品属性信息中包括了商品的厂家、商品名称、商品用途、商品价格、商品的购买次数、商品的评论等信息。
3)用户属性信息和商品属性信息交叉属性信息
用户属性和商品属性信息交叉属性中存储了用户信息和商品信息的共同特征,如用户的年龄与商品的种类的交叉,比如中老年人会购买家庭用品和养护用品,用户的性别与商品种类的交叉,比如女性用户会经常购买化妆品和护理产品,用户购买力与商品种类的交叉,比如学生会购买学习用品及自己的生活用品,用户的收藏爱好与商品种类的交叉,利用这些用户与商品的交叉信息向用户推荐产品,对产品进行优化,会具有更好的针对性,最终使不同的人成为不同的商品的忠实用户。 (4)将备选商品推荐给潜在客户
通过逻辑回归算法对客户,商品进行整理、存储,从而得到精确的客户需求,实现这个过程基于大数据的模拟训练,具体的模拟训练需要经过下面三个步骤。
1)模拟曝光步骤
所谓曝光,就是用户在浏览过程中的动作,该用户在浏览什么商品,关注什么商品,购买了一些什么商品,那么系统就将与用户所浏览购买的商品的同类商品曝光在用户面前,对于这些推荐的商品如果用户已经收藏关注该店铺,那么这类商品就是正向样本,如果系统向用户推荐的商品没有在用户的关注收藏列表,那么该类商品就是反向样本。目前,系统一般只能识别正向样本,不能识别反向样本,降低了系统的准确性,所以应采用算法改善或者几种算法协同应用来弥补这种缺陷,使系统对用户推荐商品具有更高的准确性与可靠性。
2)统计点击通过率
点击通过率即用户的实际点击次数除以商品的总浏览量。在算法推荐应用中有很多种统计点击率的方法,其中最多使用的有以下几种:以性别统计的点击率,比如女性用户相比于男性用户更多地是购买衣服、化妆品、首饰等,所以她们更多地是浏览这些商品,系统就应该对这种点击率的用戶认定为女性用户,并向她们推荐一些女性用品,但产品一定不要局限于其浏览和关注收藏的商品,还要推荐一些厨房用品等;以年龄统计的点击率,比如年轻男女浏览的大部分都是一些当下比较潮流的东西,比如电子产品、时尚服装等,系统就可以将其定性为年轻群体,针对她们的喜好推荐一些商品,如手机、相机、潮流服饰等。经常浏览老年护理产品或者中老年服装的,系统就定性为老年人,并向其推荐老年人经常用到的商品;还有就是以购买力统计的点击率,这种主要就是通过用户浏览、收藏、关注的商品的价格高低来分辨的,如果经常;浏览,购买贵重物品,如金银首饰,珠宝,汽车用品等,这类就定性为高消费群体,为这类用户推荐商品就需要推荐一些高价物品,无论是衣服、鞋帽,还是生活用品,都要选择高端商品推荐。
3)联合用户商品特性综合分析
所有用户都有自己的喜好,他们年龄不同,性别不同,高矮胖瘦不同,生活起居不同,所以通过系统对用户性别、年龄、身高、体重、爱好等进行存储整理,结合各类商家商品的厂家,商品的用途,商品的价格,商品的规格进行综合分析训练,得出用户的精准需求,向用户定向推荐商品。
随着大数据时代的到来,给这个时代带来了无限可能,同时也给我们带来了很多问题。信息网络的“信息过载”问题就是其中的一个难题,为了解决这个问题,推荐系统应运而生。本文介绍了现在在电商中应用比较广泛的推荐系统中的逻辑回归算法,通过对算法的分析,得出了本算法的优缺点,并给出了合理性的改进措施,希望大家能在这篇文章中学到一些东西。
参考文献:
[1]刘洁.电商大数据推荐系统中逻辑回归算法的应用[J].电子技术与软件工程,2021(18):154-155.
[2]王鹏越.基于逻辑回归的电商评论文本分析模型[J].数码世界,2020(04):60.
[3]刘海鸥,张亚明,苏妍嫄.大数据应用的理性回归[J].企业管理,2020(02):51-53.
关键词:电商;大数据;逻辑回归;算法应用
随着互联网科技技术的迅速发展,人们获取信息的方法越来越方便,渐渐从信息缺乏时期进入了信息过载时期。在这个时期信息的生产者与消费者都遇到了前所未有的困难。信息生产者在竞争激烈的时代如何获取信息消费者的青睐成了最关键的问题,对于信息消费者来说,如何在众多的信息中找到自己最需要的也成为难点。特别是在电子商务领域,近年来电子商务发展迅猛,线上购物方式在人们的购物生活中占据很大的比例。国外有亚马逊、易趣、沃尔玛等;国内有淘宝、天猫、苏宁、京东等众多电商企业,他们都有自己一定量的客户群,而作为客户也不是就有一个电商平台,其中的竞争激烈程度可见一斑。所以在优胜劣汰的当下就需要电商拥有一套先进可行的系统,故推荐逻辑回归算法。
一、电商大数据推荐系统中的算法种类
(1)关联规则推荐算法
所谓的关联规则算法,顾名思义是以相关联的规则为基础的推算方法。本方法的使用前提是客户已经购买某个商品,根据客户的購买情况,商品类别和其他商品相关联进行推荐。本方法简单易操作,能很好地满足零售业电商的需求,但是其要求客户必须在商家消费过并且有确切的商品种类、内容及时间,从而相互关联,这种算法也有一定的缺点,就是相关性的计算结果容易出现偏差,甚至与消费者的需求正好相反,所以,在使用时要反复校验,以确保信息的准确性。
(2)协同过滤推荐算法
协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是推荐和预测。算法通过对用户历史行为数据进行挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法,和基于物品的协同过滤算法。简单地说就是:物以类聚,人以群分。
(3)逻辑回归推荐算法
逻辑回归推荐算法是一种机械的学习,相较于其他的算法,更加简单,更加准确。因此,该算法在实际中得到了更广泛的应用。但是当该算法面对大量数据时,其工作量得到提高,工作效率就会下降。
二、逻辑回归推荐算法的优缺点
(1)优点
1)实现简单,广泛的应用于工业问题上。
2)分类时计算量非常小,速度很快,存储资源低。
3)便利的观测样本概率分数
4)对逻辑回归而言,多重共线性并不是问题,它可以结合 L2正则化来解决该问题。
5)计算代价不高,易于理解和实践。
(2)缺点
1)当特征空间很大时,逻辑回归的性能不是很好。
2)容易欠拟合,一般准确度不太高。
3)不能很好的处理大量多累特征或变量。
4)只能处理两分类问题,且必须线性可分。
5)对于非线性特征,需要进行转换。
三、逻辑回归推荐算法在电商推荐当中的主要应用
(1)逻辑回归算法的判断标准
逻辑回归算法在本质上属于线性结构,研究者在使用本算法时,应当利用客户的所有特征对算法进行训练,用户的各类特征组合是逻辑回归算法判断潜在客户和购买欲望的关键。逻辑回归算法在进行判断过程时,能够减少预测值范围,电商大数据推荐本来就属于二分类问题,就是客户的买与不买。在选定全面的数据后进行分析,通过数据解析出用户的不同特征及购买欲望,并存储解析出来的数据,判断用户是否进行购买。逻辑回归推荐算法判断简单,使用效果好,可以机械的学习,也可以基于大数据和用户特征进行自我训练。由于逻辑回归推荐算法需要的数据量过大,所以在运用时一般用其他的算法给与支持。
(2)预测用户的复购行为
在电子商务领域中,每天都有大量的用户进行购买或者复购,通过本算法可以对用户在最近一段时间内会不会复购做出预测。由于要根据用户最近的消费情况判断用户会不会在最近时期进行复购,研究者应根据用户半年内的浏览情况,购买情况,收藏情况等信息通过算法得出应该推荐的目标,再将目标记录到算法当中,来精准预测用户会不会复购。由于在机器学习领域,算法能达到的效果一般取决于数据与特征的准确性与数量,由此可以看出用户数据与特征在机械学习当中的重要意义。
(3)选择用户特征 挑选优质客户
用户每天都会进行大量的浏览甚至购买行为,通过机器学习,对客户的历史浏览、收藏、关注、购买等各类行为进行记录,还包括商品信息,如商品名称,商品价格,商品功能,商品的评价等,从而掌握用户信息,挑选优质客户。
1)用户属性信息集合
用户属性信息集合中储存了用户的所有信息,包括用户信息属性,姓名、性别、年龄、地址等;还包括用户数据信息,在购买、浏览的过程中产生的所有信息,包括用户的习惯性浏览、购物时间段,经常浏览的物品种类,浏览物品的时长,关注的店铺,收藏的店铺,购买的商品属性及购买能力;最后还包括了用户的手机型号,电脑品牌,运营商家等信息。通过以上系统储存,分析用户的各种信息,可以对用户的大概面貌进行绘画,得到用户画像。
2)商品属性信息集合
商品属性信息中包括了商品的厂家、商品名称、商品用途、商品价格、商品的购买次数、商品的评论等信息。
3)用户属性信息和商品属性信息交叉属性信息
用户属性和商品属性信息交叉属性中存储了用户信息和商品信息的共同特征,如用户的年龄与商品的种类的交叉,比如中老年人会购买家庭用品和养护用品,用户的性别与商品种类的交叉,比如女性用户会经常购买化妆品和护理产品,用户购买力与商品种类的交叉,比如学生会购买学习用品及自己的生活用品,用户的收藏爱好与商品种类的交叉,利用这些用户与商品的交叉信息向用户推荐产品,对产品进行优化,会具有更好的针对性,最终使不同的人成为不同的商品的忠实用户。 (4)将备选商品推荐给潜在客户
通过逻辑回归算法对客户,商品进行整理、存储,从而得到精确的客户需求,实现这个过程基于大数据的模拟训练,具体的模拟训练需要经过下面三个步骤。
1)模拟曝光步骤
所谓曝光,就是用户在浏览过程中的动作,该用户在浏览什么商品,关注什么商品,购买了一些什么商品,那么系统就将与用户所浏览购买的商品的同类商品曝光在用户面前,对于这些推荐的商品如果用户已经收藏关注该店铺,那么这类商品就是正向样本,如果系统向用户推荐的商品没有在用户的关注收藏列表,那么该类商品就是反向样本。目前,系统一般只能识别正向样本,不能识别反向样本,降低了系统的准确性,所以应采用算法改善或者几种算法协同应用来弥补这种缺陷,使系统对用户推荐商品具有更高的准确性与可靠性。
2)统计点击通过率
点击通过率即用户的实际点击次数除以商品的总浏览量。在算法推荐应用中有很多种统计点击率的方法,其中最多使用的有以下几种:以性别统计的点击率,比如女性用户相比于男性用户更多地是购买衣服、化妆品、首饰等,所以她们更多地是浏览这些商品,系统就应该对这种点击率的用戶认定为女性用户,并向她们推荐一些女性用品,但产品一定不要局限于其浏览和关注收藏的商品,还要推荐一些厨房用品等;以年龄统计的点击率,比如年轻男女浏览的大部分都是一些当下比较潮流的东西,比如电子产品、时尚服装等,系统就可以将其定性为年轻群体,针对她们的喜好推荐一些商品,如手机、相机、潮流服饰等。经常浏览老年护理产品或者中老年服装的,系统就定性为老年人,并向其推荐老年人经常用到的商品;还有就是以购买力统计的点击率,这种主要就是通过用户浏览、收藏、关注的商品的价格高低来分辨的,如果经常;浏览,购买贵重物品,如金银首饰,珠宝,汽车用品等,这类就定性为高消费群体,为这类用户推荐商品就需要推荐一些高价物品,无论是衣服、鞋帽,还是生活用品,都要选择高端商品推荐。
3)联合用户商品特性综合分析
所有用户都有自己的喜好,他们年龄不同,性别不同,高矮胖瘦不同,生活起居不同,所以通过系统对用户性别、年龄、身高、体重、爱好等进行存储整理,结合各类商家商品的厂家,商品的用途,商品的价格,商品的规格进行综合分析训练,得出用户的精准需求,向用户定向推荐商品。
随着大数据时代的到来,给这个时代带来了无限可能,同时也给我们带来了很多问题。信息网络的“信息过载”问题就是其中的一个难题,为了解决这个问题,推荐系统应运而生。本文介绍了现在在电商中应用比较广泛的推荐系统中的逻辑回归算法,通过对算法的分析,得出了本算法的优缺点,并给出了合理性的改进措施,希望大家能在这篇文章中学到一些东西。
参考文献:
[1]刘洁.电商大数据推荐系统中逻辑回归算法的应用[J].电子技术与软件工程,2021(18):154-155.
[2]王鹏越.基于逻辑回归的电商评论文本分析模型[J].数码世界,2020(04):60.
[3]刘海鸥,张亚明,苏妍嫄.大数据应用的理性回归[J].企业管理,2020(02):51-53.