论文部分内容阅读
大数据时代,越来越多的保险公司开始采用数据挖掘技术实现精准营销,充分挖掘客户价值,保险单的续期缴费就是其中之一。保险公司的保费部门负责保单的续期缴费工作,在缴费截止日期之前,需要对客户进行电话或亲访催缴,这种方式人力成本过大,效率低下。如果能对存在续期保费收缴困难的保险单提前预警,就可以提前做好准备,提高工作的效率。为了解决保险单续款续期缴费的问题,依据CRISP-DM标准,先从业务系统中随机抽取样本数据,然后对数据进行探索和预处理,筛选出合适的数据集。在此基础上,利用logistic回归算法构建保险单续款预测模型,评价模型并应用。深入分析模型,发现模型未考虑数据形态变化和时间因素对样本数据的影响,没有自动调参的能力,即模型存在多重共线性问题。在保险单续款业务系统中,共线性问题的产生主要受数据、变量和参数的相关性影响。根据因子分析理论和模型,本文提出从因子分析的角度处理共线性问题。在建模之前,先利用KMO检验数据变量是否需要进行因子分析,再从保险单36个数据变量中提取10个公因子,转换数据集,最后利用logistic回归算法对公因子数据集建模预测。经过实验验证,和主成分法处理共线性问题的方式相比,本文提出的提前因子分析的方式能有效降低共线性对模型的影响,利用提前因子分析的方式构建的续款预测模型的预测准确率高于主成分分析法,能达到86%以上。