论文部分内容阅读
目前使用Web日志进行用户聚类的算法,大部分都没有考虑用户访问路径中页面的有序性.针对上述问题,本文在最长公共访问路径基础上,提出了一种用户访问路径相似度的计算方法,并结合k-means算法进行用户访问路径聚类,成功地辨别出某些其它路径聚类算法难以区分的用户访问模式的不同.试验结果表明该算法更准确地反映了用户访问路径的相似程度,能够获得较高的聚类质量.