论文部分内容阅读
Web作为一种信息发布的媒体,现在已经渗透入每个人的生活中。Web页面复杂且具有动态性导致人们难以方便快捷地在Web上找出所需的数据和信息。
Web用户行为模式挖掘注重于分析并预测用户使用Web时的行为。目前该领域的研究在Web用户行为模式挖掘的预处理阶段尚无很有效的方法解决客户端信息不足产生的一些问题,路径识别的方法还很粗糙。在模式挖掘阶段对于模式的挖掘局限于独立路径范围,没有进一步考虑路径之间的关联关系。
本文主要研究与Web用户行为模式挖掘相关的技术,对Web用户行为模式挖掘的一般性框架进行讨论与改进,去除了冗繁的数据合并部分,将用户识别步骤分离出来。着重分析研究了数据预处理阶段涉及的一些技术。用户识别部分采用了折中的启发式条件,加入了用户登录信息。路径识别部分在现有最大前向路径识别算法的基础上,融合了参考长度算法的思想,提出了一种新的路径识别算法,提高了识别精度。模式发现部分加入了新提出的一种跨事务关联模式,给出其挖掘算法和实现。最后实现了该框架,并对整体系统进行简单的实验评估。