基于多方法融合的电信客户流失预测模型研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:gqkhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化建设的不断深入,电信运营商拥有海量的数据资源,运用数据挖掘技术构建电信客户细分模型和客户流失预测模型具有重要意义。本文通过分析某电信运营商某市公司的客户及业务数据,构建客户细分模型和客户流失预测模型,然后基于客户细分进行客户挽留策略研究。本文的主要工作内容有:1.本文针对电信数据的杂乱、数据量大的问题,在进行主要工作之前进行数据清洗操作。一方面通过数据分类特征可视化,分析不同数据特征对客户流失分布的影响,另一方面制定客户综合价值评判标准,将客户综合价值划分为已实现价值、未实现价值和客户忠诚度,结合业务逻辑改进K-means算法,将客户细分为五个客户群。2.使用多种特征选择方法在不同分类器上进行流失预测效果的对比,实验表明F检验法的效果最佳。另外针对数据类别不平衡的问题,本文使用随机过采样、SMOTE方法和ADASYN方法三种过采样方法在决策树和XGBoost模型上进行流失预测效果的对比。实验表明,三种过采样方法都能一定程度上提升预测效果,在决策树中使用随机过采样效果更好,在XGBoost模型中使用SMOTE方法效果更好。3.选择效果更佳的分类器(决策树、随机森林和XGBoost)作为基分类器进行模型融合,模型融合方法有Bagging和Stacking。在Bagging实验中使用决策树作为基分类器,在Stacking实验中使用决策树、随机森林和XGBoost作为基分类器,使用逻辑回归作为次分类器。实验结果表明,Bagging集成分类器相比单一决策树而言,可有效提升分类效果;Stacking集成分类器的召回率可达到85.66%,明显优于三种基分类器。4.首先对客户的业务推荐备注信息进行文本关键字挖掘,通过组合高频业务关键字得到业务推荐策略特征。然后通过分析客户综合价值和流失客户占比,对客户群的挽留优先级进行排序,以此降低挽留成本。最后结合客户流失分布情况对业务推荐策略进行评分,筛选出各个客户群下评分前若干项作为此客户群的最终挽留策略。
其他文献
目前,我国高校校友工作处于一个空前发展的新阶段,同样,在校友工作实践中也产生了一些困惑,透露出潜在的问题。在实践中,明确校友概念是解决诸多问题的关键;高校校友工作与高
目的探讨老年高血压病合并骨质疏松症患者血清血同型半胱氨酸(Hcy)水平与骨密度及骨代谢指标的相关性。方法回顾性分析自2014-03—2019-03诊治的197例老年高血压病,骨密度T值
2018年,海南开启了全岛建设自由贸易试验区,逐步探索、稳步推进中国特色自由贸易港建设的新征程。面对全面深化改革开放的趋势,税收征管环境日益复杂,单纯依靠税务部门的传统征管模式已不适应新常态的要求,如何建设更加完备健全、面向世界的自由贸易区(港)多部门协作治税体系,进一步提升社会综合治税水平,已成为摆在海南面前的重要课题。论文紧密结合在海南自由贸易区(港)建设实际,在实地走访、深入调研的基础上,借
[目的/意义]立足情报研究视角,提出一套科学有效且可复用推广的关键技术识别方法,以期为国家、地区、企业和创新机构发现、部署、推动关键技术研发前瞻性布局提供情报支撑。[
[目的/意义]科学准确识别关键共性技术对企业和国家来说都是至关重要的战略议题。[方法/过程]文章提出了一种基于专利文献分析的关键共性技术识别框架,运用文本挖掘和技术演
九曲黄河十八弯,神牛开河到偏关。明灯一亮受惊吓,转身犁出个老牛湾。民歌中唱到的老牛湾,就位于山西省偏关县境内。老牛湾是黄河拐入山西境内的第一道大湾,因长城与黄河在这
<正>基于以上三章专题讨论的结果,本章将对辽代墓葬研究中综合性的问题,诸如等级制度的构成、制度与习俗的互动、契丹与汉人墓葬的关系、墓葬的分区与分期等,作以总结分析及
会议
杜仲(Eucommia ulmoides Oliv)含有多种功能性成份,具有很好的保健功效,广泛应用在医学、食品、化妆品、饲料及工业材料等方面。近年来对杜仲的研究日益深入,其中主要进行了
<正>肌肤最害怕的不是瑕疵、不是痘痘,是岁月。草木凋零,美人迟暮,抗皱这件事早已不是40多岁人的专属,通常25岁可以预备抗初老,30岁则要正式开始抗衰老。抗衰是一场拉锯战,因
期刊
随着电子信息技术和经济全球化的深入发展,电子商务在对外贸易中的地位和作用日益显现。近年来,面对世界经济复苏乏力、发达市场内需疲软、全球贸易保护主义盛行等多重障碍,