基于仿生类算法的Web日志挖掘技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zhumuray
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的迅猛发展,尤其是Web的全球普及,使得Web上的信息量无比的丰富。通过对Web数据的挖掘,不仅可以得出关于群体用户访问行为和方式的普遍知识,用于改进Web服务设计,更重要的是,通过对用户特征的理解和分析,可以有助于开展有针对性的电子商务活动。为了解决来自用户和网站双方面的问题,自适应网站应运而生,它通过学习用户访问模式,呈现不同的界面给不同的用户并且完善网站自身拓扑结构。蚁群算法由于其独特的正反馈机制受到越来越多的关注,应用领域也越来越广阔。本文在分析了蚂蚁觅食行为和Web用户访问行为相似性的基础上,给出了基于蚁群的Web自适应站点算法,通过该方法,能使用户通过最优路径到达目标页面。另外,受蚂蚁能识别与之相遇蚂蚁是敌是友行为的启发,给出了基于蚁群本能识别能力的Web用户聚类算法,通过用户事务的相似度矩阵实现了对Web用户模式的聚类。另一方面,本文在分析遗传算法基本理论的基础上,将标准遗传算法和K-均值划分聚类方法有机的结合,给出了一种用混合遗传聚类方法对Web用户的行为进行分析的方法。该方法是一个具有全局最优解的聚类方法,其结果明显优于标准遗传聚类方法。该算法能够有效地剔除噪音,得到很好的用户聚类和页面聚类效果,为网站的管理者设计个性化的商务网站提供了有效的决策依据。最后,本文综合利用遗传算法的快速全局搜索能力和蚁群算法的正反馈收敛机制,优势互补,给出了一种融合的Web挖掘算法,该算法比单独的蚁群算法以及遗传算法在优化性能和时间性能上有一定的优势。
其他文献
随着网络和多媒体技术的迅速发展,特别是3G技术的即将普及,多媒体信息特别是视频图像信息越来越丰富,而且在我们的生活中的地位也越来越重要。数据量庞大是视频信息的一大优点,也
知识时代的来临促使当今社会的信息量以前所未有的速度增加,对决策者而言,他们面临的环境更加变幻莫测,因而更迫切需要高效的决策支持工具。由于现代体育系统的高度开放性,这
当今有关自动排课系统的研究大多根据每个学校自己的情况设计排课算法,局限于传统思路,系统的通用性和可扩展性较差。传统的排课方法无法灵活表示排课中所涉及的排课知识,而语义
伴随网络信息技术的持续发展,世界范围内数字博物馆建设也保持着蓬勃发展的良好势头。而博物馆长久以来存在的各自为政的管理模式,给博物馆领域相关数据资源实现对外开放分享
一般的系统都是在外界持续扰动力作用下工作的,这些扰动不仅导致系统的性能下降,甚至使系统失稳。由于变量测量、信号传递延时等因素的存在,时滞现象普遍存在,例如输油管道中
数据库技术的发展与推广使越来越多的应用领域在信息化的过程中受益。而随着一些新型领域的兴起,为适应其发展需求,数据库技术也在不断地扩展和丰富。其中,分布式实时数据库就是
数字图像去噪,自从被提出以来就一直是图像处理领域的基本课题之一,其难点在于无法对所有类型的图像使用同一种去噪方法而都得到很好的去噪效果。传统的去噪方法便是针对图像
随着信息技术和数据库技术的广泛应用,数据的存储规模越来越大,而数据挖掘(KDD)作为一种可以从海量数据中自动、高效地提取有价值的信息和知识,以有效地支持决策的新技术,引
随着Web服务技术的快速发展,网络上具有相同功能的Web服务越来越多,这些Web服务的区别在于其QoS的不同。用户在使用Web服务时,面临的问题是如何从这些具有相同功能的Web服务中,选
作为一种工程承载构件,钢丝绳在使用的过程中不可避免地会存在磨损、断丝等缺陷,钢丝绳在工程中的广泛应用使得对钢丝绳的缺陷检测具有重要意义。小的缺陷所产生的漏磁场往往