论文部分内容阅读
近几年来,随着互联网用户群规模的日益发展,传统广撒网,全面营销的营销方式不再适应当今环境下低成本高效果的营销需求,精准营销应时而生。相比传统营销,精准营销注重定位的精确性,维度的精密性,营销结果的可衡量性。目前来说,精准营销以其低成本高效率的优点,越来越多的受到人们的重视,无论是用户推荐,营销判断还是决策支持,都越来越渗入“精准”这一概念,各大互联网企业也在精准营销方面下足功夫。
但同时,如何精准营销,特别是如何在海量用户数据中发现有用数据,进而寻找目标用户则是迫切需要解决的问题。数据挖掘这一技术则正好能够解决这样的问题,因此,在各种精准营销手段中,数据挖掘作为背后技术,已经与其紧紧结合在一起。而数据挖掘中我们常用的分类,聚类,相关性分组等方法,由于其对用户关系数据的挖掘性质,天然的与社会网络分析这一方法产生了联系。同时,由于互联网数据的海量性,数据挖掘系统必须具备处理海量数据的能力,传统的单机解决方案很难处理如此大规模的数据,再加上用户数据增长的高速性,解决方案的可扩展性成为迫切需求,分布式并行计算技术与数据挖掘也紧密的结合在一起。
社会网络分析学说是对社会关系结构及其属性加以分析的一套方法和规范。在近年来,由于数据处理技术的发展,社会网络分析学说的研究领域也随之大大扩展,不再仅限于传统样本问卷调查所研究的小局域关系,而是扩展到几乎所有的人类活动领域,从生活到经济,从现实世界到网络虚拟社区,方方面面,都成为其分析研究的范畴。社会网络分析,数据挖掘与精准营销的结合,是当今互联网精准营销体系中广泛应用的手段。“门槛模型”则是MarkGrarlovetter提出的一个社会网络分析的经典理论:当一个人周围有许多人参与到一项活动中,该行为者也可能参加,这个界限就是“门槛”。而在互联网的精准营销中,“门槛模型”作为大众从众心理的经典社会网络分析理论,已经得到了一些应用,比如新浪微博中共同好友的关注推荐等。
但是,很遗憾的,在电信环境中,虽然运营商掌握着用户大量的特征属性数据,但是由于各种原因,目前还没有一套真正的基于社会网络分析、数据挖掘技术的精准营销系统实现。本文基于此,基于门槛模型的基本原理,利用Hadoop作为分布式平台,实现了电信环境中客户精准营销挖掘的一套系统,该系统证明了电信环境下用户自身属性与其门槛特征之间的联系,并实现了优于传统营销方式的一套门槛营销方法,完成了数据仓库的构建。
本文共分为5章,第一章介绍本文提出的相关背景,包括社会网络分析,精准营销和数据挖掘的相关介绍以及其在本文中的应用;第二章介绍本文系统的项目背景以及本文系统的商业理解;第三章介绍门槛模型精准营销系统的总体设计,包括业务模型设计以及总体架构设计;第四章介绍系统各层次的处理机制;第五章在实际数据的测试下进行了系统的有效性验证,证明系统营销思想中基本假设的正确性,并在此基础上作营销测试,对比原营销方式准确率。