一种基于模糊聚类的日志挖掘方法及应用

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:zwj54255
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了一个基于模糊相似关系的聚类方法对Web日志中提取的用户访问URL集进行聚类,同时提出基于模糊理论中的贴近度方法,通过寻找最大贴近度给新进访问用户提供推荐URL序列。应用在教学网站的日志挖掘上.结果证明该方法是有效的。文中的算法模型具有一定的通用性,在其他领域如搜索引攀和电子商务中都可以应用。但是有两个间题还需进一步研究:一是用户对各个URL的访间次序豁纳入分析中,另外站点结构中URL本身的层次关系对个性化也有影响,需加以考虑。
其他文献
随着企业业务的发展与信息的膨胀,数据仓库的规模不断扩张,数据访问呈现更广的地域分布性,提高数据仓库在Web环境下的数据访问性能是本文所讨论的内容。通过DW-DS结构来构建Web
本文提出的算法是通过在数据仓库的所有物化视图间找出相同的基表连接,并把这些连接定义成辅助视图,使用额外的存储空间存储这些辅助视图,因此这些连接只要建立一次.就可以在多
本文根据电力营销决策支持的特点,对电力营销决策支持系统中的查询方法进行了研究,实现了一组预定的分析方法,能够适应电力决策的需求,可以在年和月的级别上进行同期的比较,在地区
本文主要讨论在并行数据仓库系统ParaWare中OLAP操作的缓存技术.并行数据仓库系统ParaWare是由中国人民大学信息学院研制开发的、基于混合并行体系结构的高性能、大规模OLAP
本文以最优二叉树理论为基础,根据特征项加权形成辅助样本,并借助辅助样本和著名的Euclidean距离,提出自动聚类算法,克服了传统聚类形状单一,难以合并和分解等问题,从而提高了聚类
会议
本文以传统的数据迁移为基础,设计了一套适应数据库网格的特殊环境数据迁移协议,在迁移会话的过程中加人了资源预分配和迁移参数设定的过程,并且针对迁移会话的不同阶段,定义了一
Mediator体系结构由Wiederhold在1992年首先提出、它适用于规模很大但对查询效率要求不高且源数据经常更新的系统。与传统的数据仓库的一个主要不同是,用户是以一个虚拟的中介
会议
本文首先给出一个异构数据集成系统HDIS,HDIS是一个实验性的原型系统,它基于Mediator/Wrapper体系结构,对数据源过滤、通用Wrapper的设计、查询优化和语义冲突消解等问题都给出
会议
分布式数据挖掘由于在应用上较集中式数据挖掘具有更多的特殊性,如分布的数据源、节点间的通讯等等,都会影响到挖掘的效率.在分类问题的分布式数据挖掘中,不同节点上的分类器
会议
本文提出了一种使用直方图描述时间序列数据、查询时间序列相似度的新方法,与已有的工作相比,本文的方法具有以下优势:1.时间序列分段直方图不仅可以处理全序列匹配.还可以处理
会议