论文部分内容阅读
随着网络的不断普及,企业想要在电商领域占有一定份额,客户资源是其获得胜利的核心因素,故企业的销售模式逐渐以产品为中心转向以客户为中心的模式。对于不断增加且呈现多样化趋势的消费数据,传统的基于一维属性的统计学方法的客户细分方式已逐渐显露其弊端,取而代之的是采用相适应的数据挖掘算法对量多且复杂的数据信息实现精准而高效的客户细分。该客户细分方式凭借对现有客户的保留和对潜在客户的挖掘,分析并预测出未来市场消费趋势,以达到企业最终差异化营销的目标。为了实现上述目标,本文采用数据挖掘中的聚类分析方式运用于某服装电子商务企业进行客户细分,具体采用改进的基于近邻传播算法的K-means算法来实现系统的设计与实现。文中详细介绍了新算法的改进过程、实现流程以及通过实验验证其算法改进后的有效优势,具体表现在对数据集中的噪声点进行有效排除,并获取较为精准的初始聚类中心,同时极大的提升了聚类的准确率和各聚类之间的紧密度,实现了更令人满意的聚类效果。本论文的研究工作和成果如下:1、介绍了客户细分的相关理论,包含其概念,研究背景以及实现意义,并详细分析了客户细分中所使用的一般方法及相应步骤,通过对客户细分方法的详细探究,描述了电商领域中的该项技术的特征及不断完善的过程。2、介绍了客户细分所应用的数据挖掘技术的概念、功能以及常用的方法,并对其中的聚类分析算法的相关原理及主要的聚类方法进行了系统的概述。3、详细介绍了经典的K-means算法及通过引入AP算法,并对其中的K-means算法的聚类准则函数和AP算法的相似性度量进行了相应的改进,以便于实现对K-means算法的聚类个数和聚类中心的有效初始化,以及聚类收敛条件精确度的提升,最终生成改进的基于近邻传播算法的K-means算法,将其应用于实验验证,与前者算法进行对比,得出了能实现更佳聚类结果的结论。4、进行电子商务网站客户细分系统的设计,叙述了电子商务网站客户细分系统的整体模型,详细分析了电子商务网站客户的需求分析,包含其特点及相应的系统目标,具体阐述了数据预处理模块和数据挖掘过程模块的设计流程。5、完成了电子商务网站客户细分系统的实现,将改进的基于近邻传播算法的K-means算法应用于某服装电子商务企业中进行分析,详细描述了该算法的实现过程以及性能分析,并对细分结果加以分析,提出可行的营销策略。