基于最长公共访问路径的Web日志聚类算法的改进

来源 :第二届全国Web信息系统及其应用会议(WISA2005') | 被引量 : 0次 | 上传用户:rainbow03262009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前使用Web日志进行用户聚类的算法,大部分都没有考虑用户访问路径中页面的有序性.针对上述问题,本文在最长公共访问路径基础上,提出了一种用户访问路径相似度的计算方法,并结合k-means算法进行用户访问路径聚类,成功地辨别出某些其它路径聚类算法难以区分的用户访问模式的不同.试验结果表明该算法更准确地反映了用户访问路径的相似程度,能够获得较高的聚类质量.
其他文献
随着Web服务技术的逐渐普及,与旅游有关的Web服务越来越多,但是当前的旅游Web服务较少考虑不同服务之间的协作性.本文针对这种情况同时结合语义技术,设计了一个服务自动集成
随着信息技术的迅速发展,越来越多的企业开发和实施企业的信息化建设,建立企业网络并与Internet相联.在给企业带来信息共享、提高工作效率的同时,也给企业的信息安全带来许多
随着WebIS系统的广泛应用,高效地开发WebIS系统的需求日益迫切;框架构件技术是当前软件复用中的核心技术,但是框架构件在实例化和组装过程中效率较低.本文结合以上两个问题,
当我收到今年的《人民文学》第三期,翻起书来看文章目录,赫然地发现有黑体字的《正红旗下》老舍的长篇连载字样,顿时使我仿佛看见老舍先生复活了,又在案前奋笔疾书……。我
本文以基于RISC技术的AT90S8515单片机和RTL-8139NIC以太网接口控制器为硬件平台,针对嵌入式系统资源有限的特点,提出了一种通用的嵌入式Web服务器精简协议栈的设计与实现方
从Web应用开发模型的角度出发,分析了Web应用开发的特点和存在的问题,提出了基于模板技术实现Web应用程序代码后置、页面重用和风格统一等的解决思路.在比较现有模板技术的基
会议
针对Web服务集群系统建立了新的负载平衡模型,在该模型中重点解决了当前Web服务集群中存在的两个问题:一是负载指标确定的不完善;二是文档分配的不准确.并提出了Web服务集群
黄金不保值的说法己盛行了数年,直到1998年,黄金作为货币资产的功能获得重新肯定,黄金投资需求持续上升。以美国为例,黄金市场高度活跃,1998年金币需求刷新了70年代黄金投资
本文介绍了对象代理模型和城市历史地理信息系统的基本原理,并结合对象代理模型的特点,提出基于对象代理模型的城市历史地理信息系统,以实现历史地理信息系统中的地理对象的
提出了一种混合推荐技术,它综合了基于内容的过滤和基于单值分解的协同过滤两种推荐算法,通过加权得到最后推荐结果并通过用户的反馈调整权重.两种推荐算法都有不足之处,混合