论文部分内容阅读
针对代理渠道发展的新用户质量良莠不齐,将聚类算法引入新发展用户质量分析中,构建虚开用户模型识别代理商虚开用户。同时,还提出了k-均值聚类的改进算法。该算法结合数据样本分布以及所在区域的密度选取初始聚类中心,用于消除传统k-均值算法对初始聚类中心的敏感性。该算法应用于新发展用户的质量分析上,在虚开用户分析方面取得了良好的效果。