一种基于模糊聚类的日志挖掘方法及应用

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户：zwj54255

【摘要】

：

本文介绍了一个基于模糊相似关系的聚类方法对Web日志中提取的用户访问URL集进行聚类，同时提出基于模糊理论中的贴近度方法，通过寻找最大贴近度给新进访问用户提供推荐URL序列

【作者】

：

蔡丽萍;李茂青;

【机构】

：

厦门大学自动化系,厦门,361005

【出处】

：

第二十一届中国数据库学术会议

【发表日期】

：

2004年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文介绍了一个基于模糊相似关系的聚类方法对Web日志中提取的用户访问URL集进行聚类，同时提出基于模糊理论中的贴近度方法，通过寻找最大贴近度给新进访问用户提供推荐URL序列。应用在教学网站的日志挖掘上.结果证明该方法是有效的。文中的算法模型具有一定的通用性，在其他领域如搜索引攀和电子商务中都可以应用。但是有两个间题还需进一步研究:一是用户对各个URL的访间次序豁纳入分析中，另外站点结构中URL本身的层次关系对个性化也有影响，需加以考虑。

其他文献

基于分布式数据仓库集成与多维数据查询方法研究

随着企业业务的发展与信息的膨胀，数据仓库的规模不断扩张，数据访问呈现更广的地域分布性，提高数据仓库在Web环境下的数据访问性能是本文所讨论的内容。通过DW-DS结构来构建Web

会议

分布式数据仓库集成多维数据查询数据访问支持能力信息企业业务访问性能分布性膨胀扩张结构环境构建地域

复用基表连接的物化视图维护方法

本文提出的算法是通过在数据仓库的所有物化视图间找出相同的基表连接，并把这些连接定义成辅助视图，使用额外的存储空间存储这些辅助视图，因此这些连接只要建立一次.就可以在多

会议

复用基表连接物化视图数据仓库视图更新辅助视图更新时间更新频率存储空间特性算法

电力营销决策支持系统中的查询方法

本文根据电力营销决策支持的特点，对电力营销决策支持系统中的查询方法进行了研究，实现了一组预定的分析方法，能够适应电力决策的需求，可以在年和月的级别上进行同期的比较，在地区

会议

电力营销决策支持系统查询方法实验结果分析对比和分析数据模型数据仓库分析方法地区之间查询处理行业基础

PV-Cache:基于预取视图的数据仓库缓存管理器

本文主要讨论在并行数据仓库系统ParaWare中OLAP操作的缓存技术.并行数据仓库系统ParaWare是由中国人民大学信息学院研制开发的、基于混合并行体系结构的高性能、大规模OLAP

会议

视图数据仓库系统并行体系结构缓存管理器研制开发相关工作系统性能实验评价缓存技术分析系统信息学高性能中国应用设计人民大学操作

基于最优二叉树原理的自动聚类的设计

本文以最优二叉树理论为基础，根据特征项加权形成辅助样本，并借助辅助样本和著名的Euclidean距离，提出自动聚类算法，克服了传统聚类形状单一，难以合并和分解等问题，从而提高了聚类

会议

数据库网格的数据迁移协议

本文以传统的数据迁移为基础，设计了一套适应数据库网格的特殊环境数据迁移协议，在迁移会话的过程中加人了资源预分配和迁移参数设定的过程，并且针对迁移会话的不同阶段，定义了一

会议

数据库网格数据迁移会话资源预分配迁移协议迁移过程环境数据参数设定标准化原语用户应用设计交互基础部件

异构数据集成系统中Mediator查询优化算法研究

Mediator体系结构由Wiederhold在1992年首先提出、它适用于规模很大但对查询效率要求不高且源数据经常更新的系统。与传统的数据仓库的一个主要不同是，用户是以一个虚拟的中介

会议

异构数据集成中包装器Wrapper的设计

本文首先给出一个异构数据集成系统HDIS,HDIS是一个实验性的原型系统，它基于Mediator/Wrapper体系结构，对数据源过滤、通用Wrapper的设计、查询优化和语义冲突消解等问题都给出

会议

一种改进的基于加权平均后验概率的1-层泛化方法

分布式数据挖掘由于在应用上较集中式数据挖掘具有更多的特殊性,如分布的数据源、节点间的通讯等等,都会影响到挖掘的效率.在分类问题的分布式数据挖掘中,不同节点上的分类器

会议

基于分段直方图的时间序列相似度查询

本文提出了一种使用直方图描述时间序列数据、查询时间序列相似度的新方法，与已有的工作相比，本文的方法具有以下优势:1.时间序列分段直方图不仅可以处理全序列匹配.还可以处理

会议

一种基于模糊聚类的日志挖掘方法及应用

其他学术论文