【摘 要】
:
近年来,随着电商行业的蓬勃发展,越来越多的人关注O2O(Online To Offline)电子商务模式。优惠券作为O2O模式吸引顾客的一种重要营销手段,常被商家和电商平台所采用。然而,优惠券被发放后,无法预估用户是否会使用该优惠券,可能会造成资源的浪费等问题。只有通过分析用户的历史消费行为,提前判断该用户是否会使用优惠券,以此作为优惠券的发放依据,才能在减少浪费资源的同时提高营销能力。所以,对优
论文部分内容阅读
近年来,随着电商行业的蓬勃发展,越来越多的人关注O2O(Online To Offline)电子商务模式。优惠券作为O2O模式吸引顾客的一种重要营销手段,常被商家和电商平台所采用。然而,优惠券被发放后,无法预估用户是否会使用该优惠券,可能会造成资源的浪费等问题。只有通过分析用户的历史消费行为,提前判断该用户是否会使用优惠券,以此作为优惠券的发放依据,才能在减少浪费资源的同时提高营销能力。所以,对优惠券的使用预测研究具有一定的现实应用意义。本文应用特征工程完成了数据集上的特征构造,提出了一种特征选择算法MIRFS(Mutual Information-Random Forest-Sequential Backward Selection),并使用该算法对所构造的特征实施了特征选择。为解决正负样本不平衡问题,基于XGBoost算法提出了一种预测算法BG-XGBoost(Balanced Bagging Classifier&Genetic AlgorithmXGBoost),并基于此算法构建了O2O优惠券使用预测模型。最后,设计并实现了O2O优惠券使用预测系统。本文的主要研究内容如下:(1)对O2O优惠券的研究背景、研究意义以及国内外研究现状进行分析;研究了数据挖掘技术、特征工程技术及其相关算法的理论与原理。(2)对原数据集进行数据预处理、打标以及划分,并对预处理后的数据集进行数据统计分析和可视化分析。基于原始特征结合数据分析结果进行特征构造,得到5个基础特征群(即用户特征群、商家特征群、优惠券特征群、时间特征群和距离特征群)和2个组合特征群(即用户-优惠券特征群和用户-商家特征群),共计111个特征。(3)提出了一种特征选择算法MIRFS,并利用该算法对所构造的111个特征进行特征选择,从中选择出48个评价得分高的特征。为了验证MIRFS算法的有效性,基于特征选择前后的样本数据,采用AUC、F1值和训练时间等评估指标,选择XGBoost、Random Forest、GBDT和Light GBM四种算法进行了建模对比。实验结果表明,四个算法在使用MIRFS特征选择后的样本数据上的分类性能均得到了一定的提升。(4)为处理正负样本不平衡问题,提出一种基于XGBoost的BG-XGBoost预测算法,并以此构建了O2O优惠券使用预测模型。实验结果表明,使用BG-XGBoost算法构建的预测模型,AUC达到了0.8642,提升了1.41%,F1值提高了6.39%,说明本文提出的BG-XGBoost算法比其他集成学习算法能够更好地处理正负样本不平衡问题。(5)设计并实现了一个O2O优惠券使用预测系统。
其他文献
随着我国共享经济时代的到来和国民环保意识的提升,自行车以其灵活、便捷、无污染、可达性高以及能够有效解决“最后一公里”问题等特点,重新回到了大众的视野,成为城市交通系统重要的组成部分。然而,由于我国人口密度较大、道路环境复杂,且非机动车辆管理存在漏洞,自行车交通事故数量逐年攀升,成为威胁交通系统安全的重大隐患。骑行者作为自行车的直接操纵者,其具体行为直接影响到行车安全。在行为决策过程中,骑行者通过感
水是地球生命生存最重要的资源之一,水环境的种种问题严重影响了人类生存和社会经济的稳步发展。岷江是长江的重要一级支流,岷江(眉山段)属于岷江中游,眉山每年产生的各类废污水对岷江水环境有极大风险,极易造成水体污染,深度评价与改善眉山市岷江流域的水质状况是目前亟待解决的重要问题。近年来,我国已发生多起水体污染事故,造成的后果非常严重,水安全问题越来越受到重视,水质安全评价属于水安全领域的重要方面,本文针
裂纹闭合效应自被发现以来便成为各国学者的研究热点。传统裂尖应力场模型无法描述裂尖塑性区及尾迹区对裂尖应力场的影响,而CJP模型可以弥补传统模型的不足,且在针对聚碳酸酯、工业纯钛、铝合金等材料的塑性诱导裂纹闭合效应形成机理研究中取得了丰硕成果。车轴在服役过程中承受的载荷复杂,且受到轮轨激励等因素导致的过载影响,因此本文以高速列车EA4T车轴钢为试验材料,借助数字图像相关技术,开展过载条件下的紧凑拉伸
随着目前人们生活物质水平的日益提升,生活节奏也随之不断地加快,城市的交通运输能力已经成为了制约整个城市进步的重要原因之一。城轨车辆的制动系统性能对车辆能否在行驶过程中快速高效地停车起着决定性的作用,是城轨车辆安全的重要性能。然而随着目前城市轨道交通的高速发展,现阶段的正在运营的车辆数量的不断增加,因为制动系统故障所引起的行车安全问题也越来越频繁。所以对城轨车辆制动系统进行故障分析来提高行车安全及可
女性乳腺癌在2020年已经超过肺癌成为全球癌症发病率的第一大病因。在乳腺癌早期阶段正确诊断以及时获得治疗,可以极大的提高病人的存活率。因此,乳腺早期的正确诊断得到了广泛的关注。超声波成像由于其易于使用、体积小、非侵入方法性和低成本等特性,已经成为临床医师在早期筛选中检查乳腺组织良恶性的首选。同时,今年来超声造影使用也逐渐广泛。大多数临床诊断中,都是联合B性超声和超声造影作为主要的诊断方法。因此,本
当前社交媒体发展迅速,各种各样的信息时刻地被发布与转发。信息时代带来众多便利的同时,我们也被众多的谣言、虚假信息所包围着。谣言的广泛传播,容易对网络安全和社会稳定造成严重的威胁。如何从社交媒体广泛的、多模态的信息中有效识别出谣言成为目前的研究热点。而在检测研究中需要基于大量的数据集对算法模型进行训练,这一过程容易造成私有数据集或隐私数据的泄露,对社交媒体平台或用户的利益造成损害。本文基于深度学习方
轨道不平顺是轮轨系统的主要激扰源,是造成车体各种振动的主要原因,对列车运营的安全性、乘客乘坐的舒适性、养护维修的经济性等都有着巨大的影响。在我国高速铁路不断发展的大背景下,伴随着车速提升带来的高速度、客货共线带来的高密度等问题对轨道的平顺性提出了更高的要求。为此,对轨道的平顺性状态进行科学合理的评价就显得尤为重要。目前,我国针对线路养护维修工作所采用的主要评价方法仍是均值管理和峰值管理。均值管理针
光子可以理解成量子化电磁场的单模激发态,量子化电磁场的模式6)中单个光子的能量可以通过频率与普朗克常数?表示为?。单光子可以理解成光子数的统计平均值为1与方差为零的单光子态。单光子探测技术在国防、国家安全以及量子通信等领域中扮演重要角色,是当下我国急需抢占的科技制高点,具有重要的研究意义。本文中的单光子探测主要面向可见光到近红外波段的弱光以及能量更低的微波频段的微波单光子。首先,对射频电路与系统的
我国高速列车运营速度目前最高达350 km/h,车辆噪声问题也随列车速度的提高愈发突出。由于受电弓几何结构复杂,在列车高速运行过程中会对气流产生扰动从而辐射气动噪声,同时脱落的漩涡撞击车体壁面在车体表面产生湍流脉动压力。此外,受电弓在弓网接触力和气动抬升力的共同作用下也会对车体产生力激励。上述多种激励经复杂的车顶结构和空气对车内噪声产生贡献。因此,相比客室中部以及普通转向架上方车厢,受电弓下方车厢