论文部分内容阅读
[摘要] 本文重点讨论了在CRM中应用关联规则挖掘技术进行房地产业客户意向分析的问题。对调查数据进行了挖掘得出了较多有价值的模型和规则,并比较客观地反映了城市居民对住房的需求情况。
[关键词] 数据挖掘客户关系管理(CRM)关联规则[摘要] 本文重点讨论了在CRM中应用关联规则挖掘技术进行房地产业客户意向分析的问题。对调查数据进行了挖掘得出了较多有价值的模型和规则,并比较客观地反映了城市居民对住房的需求情况。
[关键词] 数据挖掘 客户关系管理(CRM) 关联规则
一、引言
消费者已经进入了“以客户为中心”时代,各方面的需求都进入了个性化、定制的阶段,这也正是目前房地产行业客户关系管理(Customer Relationship Management , CRM)系统应用与现实的矛盾所在。随着数据挖掘技术的发展,能够帮助企业从大量的、不完全的、有噪声的、模糊的、随机的CRM数据中提取潜在有用的信息和知识,来解决这些问题。
二、关联规则挖掘技术
关联规则挖掘(Association Rules Mining)是数据挖掘技术中的一个重要研究方向,它是由Agrawa1,Imielinski和swami于1993年首先提出的。关联规则是数据挖掘的众多知识类型中最为典型的一种。
关联规则挖掘的算法有多种, 最经典的是Apriori 算法, 许多关联规则挖掘算法都是基于该算法。因此, 这里用Apriori 算法开采频集, 并由频集产生相应的关联规则。具体做法详见文献。下面给出发现频繁项集的Apriori算法的伪代码描述。
Input: A dataset D,with min_sup
output: The frequent itemsets of D
Method:
(1)L1=frequent1-itemsets Li(D);
(2)for (k=2:Lk-1≠Φ;k++)
(3)begin
(4)Ck=apriori_gen(Lk-1,min_sup);
(5)for each transactions t∈D
(6)output Ct=subset(Ck,t);
(7)for each candidates C∈Ct
(8)c.count++;
(9)end
(10)Lk={c∈ck|c.count>=min_sup};
(11)end
(12)return L;
上面的代码清晰的描述了Apirori算法.
三、关联规则挖掘技术在房地产客户关系管理系统中的应用
下面是一个基于房地产客户分类的关联分析,如某小区购置不动产随机数据产生频繁项目集的过程:
用项目集在数据中出现的次数来作为支持度,设min_sup=3,从图中看出,C3到L3的产生过程,引入修剪后候选集的规模比原来减小了。
根据交易数据,产生频繁项目集过程:
数据说明:I1表示:”购买多层户型”; I2表示:”购买小高层户型” ;I3表示:”购买高层户型”; I4表示:”租赁车位”; I5表示:”购买车位”;例如T1表示:”购买多层户型”,“租赁车位”。
这关联规则是否可信,则要根据规则的支持度(support)和置信度(confidence)做出量化判断。由支持度的计算公式和置信度的计算公式:
经过挖掘发现一些有价值的关联规则:
可见, 表中列出的关联规则均具有较高的支持率和可信度。然而, 为了更加准确地挖掘出有意义的关联规则, 还可以进行更深一步地挖掘即对挖掘出的关联规则更换因果关系, 形成新的关联规则。
四、结束语
房地产行业是一个数据量大、关联性强、影响因素多的复杂非线性系统。数据挖掘技术在房地产行业的应用是一个年轻且充满希望的研究领域,人们对它的研究正日益广泛和深入。解决好这些问题,对于政府部门合理分析产业发展,制定产业政策及开发企业和个人正确判断房地产市场形势、做出投资或购房决策具有重要意义。
参考文献:
[1]张蓉:数据挖掘技术在房地產客户关系管理系统中的应用.现代情报,2006.6
[2]Pang-Ning Tan Michael Steinbach Vipin Kumar,Introduction to Data Mining,Post & Telecom Press ,2006.5
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。
[关键词] 数据挖掘客户关系管理(CRM)关联规则[摘要] 本文重点讨论了在CRM中应用关联规则挖掘技术进行房地产业客户意向分析的问题。对调查数据进行了挖掘得出了较多有价值的模型和规则,并比较客观地反映了城市居民对住房的需求情况。
[关键词] 数据挖掘 客户关系管理(CRM) 关联规则
一、引言
消费者已经进入了“以客户为中心”时代,各方面的需求都进入了个性化、定制的阶段,这也正是目前房地产行业客户关系管理(Customer Relationship Management , CRM)系统应用与现实的矛盾所在。随着数据挖掘技术的发展,能够帮助企业从大量的、不完全的、有噪声的、模糊的、随机的CRM数据中提取潜在有用的信息和知识,来解决这些问题。
二、关联规则挖掘技术
关联规则挖掘(Association Rules Mining)是数据挖掘技术中的一个重要研究方向,它是由Agrawa1,Imielinski和swami于1993年首先提出的。关联规则是数据挖掘的众多知识类型中最为典型的一种。
关联规则挖掘的算法有多种, 最经典的是Apriori 算法, 许多关联规则挖掘算法都是基于该算法。因此, 这里用Apriori 算法开采频集, 并由频集产生相应的关联规则。具体做法详见文献。下面给出发现频繁项集的Apriori算法的伪代码描述。
Input: A dataset D,with min_sup
output: The frequent itemsets of D
Method:
(1)L1=frequent1-itemsets Li(D);
(2)for (k=2:Lk-1≠Φ;k++)
(3)begin
(4)Ck=apriori_gen(Lk-1,min_sup);
(5)for each transactions t∈D
(6)output Ct=subset(Ck,t);
(7)for each candidates C∈Ct
(8)c.count++;
(9)end
(10)Lk={c∈ck|c.count>=min_sup};
(11)end
(12)return L;
上面的代码清晰的描述了Apirori算法.
三、关联规则挖掘技术在房地产客户关系管理系统中的应用
下面是一个基于房地产客户分类的关联分析,如某小区购置不动产随机数据产生频繁项目集的过程:
用项目集在数据中出现的次数来作为支持度,设min_sup=3,从图中看出,C3到L3的产生过程,引入修剪后候选集的规模比原来减小了。
根据交易数据,产生频繁项目集过程:
数据说明:I1表示:”购买多层户型”; I2表示:”购买小高层户型” ;I3表示:”购买高层户型”; I4表示:”租赁车位”; I5表示:”购买车位”;例如T1表示:”购买多层户型”,“租赁车位”。
这关联规则是否可信,则要根据规则的支持度(support)和置信度(confidence)做出量化判断。由支持度的计算公式和置信度的计算公式:
经过挖掘发现一些有价值的关联规则:
可见, 表中列出的关联规则均具有较高的支持率和可信度。然而, 为了更加准确地挖掘出有意义的关联规则, 还可以进行更深一步地挖掘即对挖掘出的关联规则更换因果关系, 形成新的关联规则。
四、结束语
房地产行业是一个数据量大、关联性强、影响因素多的复杂非线性系统。数据挖掘技术在房地产行业的应用是一个年轻且充满希望的研究领域,人们对它的研究正日益广泛和深入。解决好这些问题,对于政府部门合理分析产业发展,制定产业政策及开发企业和个人正确判断房地产市场形势、做出投资或购房决策具有重要意义。
参考文献:
[1]张蓉:数据挖掘技术在房地產客户关系管理系统中的应用.现代情报,2006.6
[2]Pang-Ning Tan Michael Steinbach Vipin Kumar,Introduction to Data Mining,Post & Telecom Press ,2006.5
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。