WEB用户行为模式挖掘的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:wfn031641lpp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web作为一种信息发布的媒体,现在已经渗透入每个人的生活中。Web页面复杂且具有动态性导致人们难以方便快捷地在Web上找出所需的数据和信息。 Web用户行为模式挖掘注重于分析并预测用户使用Web时的行为。目前该领域的研究在Web用户行为模式挖掘的预处理阶段尚无很有效的方法解决客户端信息不足产生的一些问题,路径识别的方法还很粗糙。在模式挖掘阶段对于模式的挖掘局限于独立路径范围,没有进一步考虑路径之间的关联关系。 本文主要研究与Web用户行为模式挖掘相关的技术,对Web用户行为模式挖掘的一般性框架进行讨论与改进,去除了冗繁的数据合并部分,将用户识别步骤分离出来。着重分析研究了数据预处理阶段涉及的一些技术。用户识别部分采用了折中的启发式条件,加入了用户登录信息。路径识别部分在现有最大前向路径识别算法的基础上,融合了参考长度算法的思想,提出了一种新的路径识别算法,提高了识别精度。模式发现部分加入了新提出的一种跨事务关联模式,给出其挖掘算法和实现。最后实现了该框架,并对整体系统进行简单的实验评估。
其他文献
联想记忆的实现一直是人工神经元网络研究的方向之一,其中一个重点就是实现多对多联想记忆。多对多联想记忆的核心是如何实现一对多联想记忆,也即是如何识别记忆模式中的公共项
在大数据技术的驱动下,教育数据研究对教育发展规律探索的作用愈加重要。通过挖掘、分析教育数据,从更深层揭示教育发展轨迹。深度挖掘教育数据中的隐藏信息,可以暴露教育过
随着计算机网络信息化技术及医学影像学技术的飞速发展,基于影像技术的现代医疗正以其独特的魅力步入数码时代;同时作为经验科学范畴的医疗事业,其发展,对内对外都必须百家争鸣,促
随着网络信息的飞速增长,对于文本聚类技术的研究显得更为重要。由于文本数据高维性和稀疏性,传统的文本聚类算法并不能让人满意。IB方法是基于信息论的数据分析方法,该方法通过
Ad Hoc 网络技术起源于20世纪70年代的美国军事领域,它是在美国国防部资助研究的"战场环境中的无线分组数据网"项目中产生的一种新型的网络架构技术。 移动Ad Hoe网络是IP
随着网络的普及和深入,分支机构众多的大型单位越来越多地在公网上进行远程办公,迫切需要一个可靠、简单、高效、灵活的防火墙网关解决方案,保证机密数据在公网上安全传输。
随着计算机技术及测量技术的发展,逆向工程已经成为新产品开发、消化以及吸收先进技术的重要途径。逆向工程的主要任务之一是由实物样件的测量数据重构CAD模型。由于特征模型
对等(peer-to-peer,简称P2P)网络技术近年来发展迅速,以Tapestry、Pastry、Chord、CAN为代表的结构化P2P网络具有扩展性好、可以在有限的跳数内定位到资源等优点,成为当前研究热
随着信息社会的发展,综合布线的地位变得越来越重要。几乎所有的商务大厦、办公大楼、园区建筑的信息化都需要依赖于综合布线的实现。综合布线的规模随着大楼及楼群规模的增加
多播是一种群组通信的手段,要求将信息从一个数据源同时传送到多个目的地。构造多播树是解决多播路由问题的常用方法。有3种不同类型的多播树:基于数据源的树、Steiner树和基于