论文部分内容阅读
针对Web挖掘中的用户相似性问题,本文提出了一种基于相对曼哈顿距离的用户聚类算法。首先根据Web服务器日志数据信息,建立URL和用户关联矩阵,元素值分别为用户的访问次数及访问时间,并以此构建平均时间矩阵。在此基础上利用相对曼哈顿距离给出客户之间的距离,确定阈值后进行聚类。最后定义了类关联度,对聚类结果进行了确认和筛选,算例表明该算法具有良好的可操作性和准确性。