论文部分内容阅读
为了解决数据流聚类算法中有效处理离群点这一关键问题,改进了基于密度的数据流聚类算法,在DenStream算法基础上提出了具有双检测时间策略DDTs(double detection timestrategy)的基于密度的数据流聚类算法。该策略在数据流流速波动的情况下,结合时间与流数据数量两方面因素对微簇进行测试。通过在线动态维护和删减微簇,保存可能升级的离群点来改善聚类效果。实验结果表明,改进算法具有良好的适用性和有效性,能够取得较高的聚类质量。