商店销售数据的预测模型研究

来源 :东北财经大学 | 被引量 : 0次 | 上传用户：jingjing17_

【摘要】

：

【作者】

：

刘春秀

【机构】

：

东北财经大学

【出处】

：

东北财经大学

【发表日期】

：

2021年01期

【关键词】

：

Stacking融合模型销售预测 CatBoost 孤立森林

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着当今互联网业务的不断发展,冲击着线下业务,给线下门店带来了巨大的挑战。诚然,线下商店仍然有存在的必要。其不仅可以让用户体验产品,全方位的了解一个新产品的性能,而且即便供应链和快递业如何发展,也没有线下门店可以让顾客即时收到货的优势。但是线下门店也承担着更多的费用,人力成本,门店租金等等。为了能够良好转型,也实现线下门店的长足发展,这时候急需我们用先进的思路更新旧有的线下销售模式,降低成本,提高收益。本文的目的主要是科学的预估不同商店内的不同产品的月销量,为线下门店预计订多少货品提供参考依据,以减少产品的积压,降低一定的库存成本。本文的研究过程中主要用了文献研究法、案例分析法以及机器学习等一些统计方法。阅读国内外文献上,从目前国内外学者研究情况来看,对于商品销售预测主要基于时序数据,建立时间序列模型,或者更先进一些的长短时记忆神经网络。但是对产品价格浮动,过去时间段内销量均值,产品类别等因素对销量的影响,目前研究不深;同时,目前研究涉及的模型包含一些机器学习的方法,如XGBoost,神经网络等等,主要是直接给出设定的参数值或者使用的参数默认值。本文还在特征的选择,参数的调整做出了努力。此外,还对几个单模型进行融合,查看效果。选取案例上,本文利用的数据是kaggle网站的比赛数据,这些数据信息真实有效。它包含着连锁商店34个月内各个商店各个产品的每天的销售量以及销售价格,还包含着商店及产品的ID等信息。本文通过初步的描述性统计结果来看,销量主要由一些大型商店贡献,故筛选总销售量前十五的商店进行研究,得到更多有效数据,使实验结果更有代表性。此外,还对数据的异常值进行了分析和剔除,本文主要用孤立森林的方法实现。进一步地,对数据进行特征工程,如产品价格的波动特征、产品销量的浮动特征、产品销量的滞后特征等。得到更多信息,提高建模结果,并可查看哪种变量对销量有着更大的影响。在建模过程中用了很多机器学习方法,并基于方法的假设要求对数据进行不同的处理。首先,利用CatBoost包建立CatBoost模型,查看各变量的重要性,发现年份月份、产品销量的历史值和均值、产品类别对销量有着重要影响。同时,用XGBoost包建立XGBoost模型,由于XGBoost模型不能自动处理分类型变量,本文数据中的变量类别过多,不能做哑元处理,故直接选择剔除所有分类型特征。建模发现发现商店的销量,产品的销售滞后特征对销量也有着影响。在建立,XGBoost和CatBoost模型时,也利用网格搜索确定学习率、最大树数等的参数选择。最后,使用机器学习包sklearn,建立随机森林、线性回归、k近邻模型。利用了网格搜索对随机森林的最大树深、树的数目等参数进行选择,并利用随机森林返回的变量重要性作为变量筛选依据,确定线性回归的入模变量。同样的利用网格搜素对k近邻模型的k值进行确定。综上几种模型可知,产品的价格以及浮动对产品的需求影响不大。对于线下门店的产品来说,顾客更关注产品本身,受价格影响不大;产品的过往销量很值得参考,一般来说产品之前的销量大,今后的销量也倾向于大;商店的总销售量对产品的销售量也有所影响,商店本身的销售额大,顾客多,人流旺盛,也可以促进相应产品的销量。通过以上的分析研究我们可以给予线下商店经营管理方面的建议:1.在考虑产品制造的产能和商店的库房规模和存放资金下,适当的增加销售量大的商店产品供应量。从几个模型来看,商店的各类商品平均销售额大,其下一期销量也倾向于高。每个商店只能出售自己已有的商品,在货物充足的情况下,某些商店的产品可能高于目前得到的数据,对一些大型商店,可以适当乐观估计销量,增大其配货。也可进一步增大客流,促进销售。2.对热销产品可以减少价格促销。从各模型返回的变量重要性来看,顾客对价格并不是很敏感,产品价格以及价格浮动这些变量的重要性均很低,甚至不作为入模的变量。可见,价格对销量影响并不明显,用户更关注产品本身。3.销量大小也与特定的时间有着明显的关系。从数据来看,年初和年末的销售量普遍高,故经营者可在这些时间区间内,加大人力投入,同时增大各产品货源供应,减少客户的遗失。4.Stacking融合模型的预测结果可以作为库存管理的一部分依据。通过结果可以看到模型预测结果的MAE仅为0.1多,与真实销量差距为0.1上下,预测结果还是比较准的,可以作为订货的参考。

其他文献

阴道超声用于盆腔粘连致不孕症治疗的临床观察

＜正＞目的应用阴道超声对盆腔粘连致不孕症治疗的临床观察。方法选择2002年1月～2005年6月,确诊为慢性盆腔炎,盆腔粘连致不孕的不孕症门诊患者338例。采用输卵管给药,配合中药灌肠治疗方法。超声判断盆腔粘连程度,同时对照原来的超

会议

双循环背景下农产品国际贸易路径研究——以茶产品为例

茶叶作为我国特色的农产品，也是传统对外出口的产品。作为茶叶销售大国，虽然我国茶叶出口量实现显著提升，但是受到国际贸易环境的影响，茶叶产品在国际市场中的发展还面临着激烈的产品竞争，以及贸易壁垒等问题，造成我国茶叶出口与发达国家相比较仍存在一定的差距。为解决我国农产品国际贸易问题，本文立足双循环政策下，分析当前茶产品国际贸易发展现状，并积极探索具体的发展路径，提出解决的方法和对策，以期为茶产业的发展提

期刊

双循环农产品国际贸易茶产品

浅论余映潮文言文教学中的“主问题”设计

语文名师余映潮率先提出语文课堂教学的“主问题”设计理念，并身体力行地在文言文教学中进行应用。他从课文朗读的层次、方法和形式，品鉴字词的字义、文意与方法，赏析文本的内容、艺术技巧和思想情感出发，设计精巧的课堂“主问题”，让“文”“言”得到整合，创造出更加高效、富有美感的文言文课堂，引领学生深刻领悟文言文之美。

期刊

余映潮主问题文言文教学

行动导向法在中职信息技术教学中的应用探索

行动导向是一种创新的教学模式，在中职信息技术教学中应用行动导向法，不仅能够强化学生信息技术探究兴趣，也能延展信息技术教学活动的内容和形式，历练学生对信息技术理论知识的实践技能。故主要分析行动导向法在中职信息技术教学中的应用意义，从创设多样化教学情境、设计小组式探究任务、实施案例类分析活动、开展实践型项目活动以及建立交互式评价机制五个方面，论述行动导向法具体的应用策略，旨在为广大教育工作者革新信息技

期刊

行动导向法中职信息技术教学

分化与整合：校地共建式新型研发机构的组织战略

通过引入混合型组织的战略管理的相关理论，以两家典型案例的比较研究为基础，分析了校地共建式新型研发机构应对制度混合问题的组织战略及其战略组合。研究发现，校地共建式新型研发机构主要采取了分化和整合两种基本战略。其中，分化战略，有助于组织实现市场的灵活性、合法性以及内部任务的清晰性，但可能导致缺乏统一外部形象和引发内部冲突。整合战略，则有助于组织构建整体形象和加强内部合作，但可能导致缺乏市场灵活性和引发

期刊

校地共建新型研发机构组织战略分化整合

深度学习CT图像迭代重建及其用于儿童CT进展

人工智能在分割、重建医学及图像处理等方面均发挥重要作用。儿童CT检查应遵循尽可能低辐射剂量原则，即在低辐射剂量下最大限度保持或获得更高图像质量。本文对基于人工智能的深度学习CT图像迭代重建技术及其用于儿童CT进展进行综述。

期刊

体层摄影术X线计算机深度学习儿童图像质量

速冻食品发展现状及对策研究

由于速冻食品不受地域、季节限制，并且可延长产品保质期，受到了广大消费者的欢迎。此外，速冻食品具有耐储藏、运输便捷等优点，使速冻食品产业经济得到了进一步发展。因此，本文介绍了速冻食品的发展历程，阐述了速冻食品存在的问题，并提出相应的解决对策，为速冻食品的进一步发展提供参考。

期刊

速冻食品发展现状问题解决对策

基于机器学习的企业内审机构组织效能评价研究

内审机构作为履行内部审计职能的主要载体，其组织效能能够综合地反映企业内部审计质量。文章在已有研究的基础上全面分析了内审机构组织效能的影响因素，基于成长性、独立性、权威性、专业性、职业行为和审计环境六个评价维度，构建了企业内审机构组织效能评价指标体系。通过调查问卷方式获取845个有效样本作为指标数据，利用模糊C-均值聚类算法实现组织效能等级标签的标注，使用决策树、支持向量机、人工神经网络、随机森林、

期刊

内部审计组织效能机器学习

习近平：伟大抗美援朝精神是弥足珍贵的精神财富

＜正＞"雄赳赳,气昂昂,跨过鸭绿江。"70年前,1950年10月19日,中国人民志愿军开赴朝鲜前线。70年后,2020年10月19日,纪念中国人民志愿军抗美援朝出国作战70周年主题展览在北京开幕。习近平总书记在参观展览时强调,要在新时代继承和弘扬伟大抗美援朝精神。

期刊

变电站安装施工过程中电气安装技术分析

随着我国经济的快速发展,工业用电及生活用电量不断的上升,有效促进了我国发电站及变电站的建设。电气设备安装技术质量直接关系到变电站最终的运行质量,因此对变电站安装施工过程中电气安装技术进行分析与探讨,是确保变电站工作质量的基础。

期刊

变电站电气设备安装技术

商店销售数据的预测模型研究

其他学术论文