基于Web日志挖掘的Web文档聚类

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户：climb_climb

【摘要】

：

Web日志挖掘是Web挖掘的一种，介绍了Web日志挖掘的一般过程，研究了k—means聚类算法，并分析了k-means聚类算法的不足。k-means聚类算法迭代过程中每次都需要计算每个数据对象到

【作者】

：

高哲魏海平王福威赵晓碧

【机构】

：

辽宁石油化工大学计算机与通信工程学院

【出处】

：

计算机工程与设计

【发表日期】

：

2008年18期

【关键词】

：

日志挖掘 WEB日志 K-MEANS 文档聚类日志预处理 web log mining web log k-means web document clu

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Web日志挖掘是Web挖掘的一种，介绍了Web日志挖掘的一般过程，研究了k—means聚类算法，并分析了k-means聚类算法的不足。k-means聚类算法迭代过程中每次都需要计算每个数据对象到簇质心的距离，使得聚类效率不高，针对这个问题，提出了k-means聚类算法的改进算法，该算法避免了重复计算数据对象到簇质心的距离，并用这两种算法实现了Web文档的聚类。试验结果表明，该改进算法提高了聚类效率。

其他文献

对后冷战时代中美关系危机管理的探讨

后冷战时代,中美关系波折多变,危机四伏,大致经历了十个演变周期.产生危机的根源在于中美两国综合国力发展的不平衡和实力的不对称,因此,中美关系既有波动性,又有韧性.中国对

期刊

后冷战时代中美关系危机管理post cold war period the Sino-Amemcan relationship crisis admi

浅谈总配线架增容技术

期刊

电信分公司电信市场电信运营商厂家电信公司发展小灵通总配线架MDFADSL

在电信企业建立企业计算中心的设想及实现策略

期刊

电信企业企业计算中心数据仓库不均衡性负载均衡J2EE

热烈庆祝《电信科学》创刊50周年

期刊

高速光通信系统中的色散问题及其补偿研究

当光纤通信系统单信道速率升级到40Gbit/s及以上时 ,色度色散 (CD)和偏振模色散 (PMD)已经成为严重影响系统性能的主要因素。本文主要从补偿的必要性、关键技术、主要方法和解决方案等方面分别对CD和PMD及其补偿进行了较详细的研究

期刊

光通信系统色度色散偏振模色散色散补偿high-speed optical fiber communication systemchromatic di

新型宽带城域网中的二层汇聚技术探讨

期刊

宽带城域网技术探讨汇聚二层网络结构通信网络持续增长业务要求可运营运营商

亚像元配准技术研究

为了获得高精度的图像运动参数估计,需要比较各种传统的图像配准算法的优劣并改进它们以满足需求。为此综述超分辨率重建中的图像配准算法,指出各种配准算法的特性,同时结合实验分析了不同的配准算法进行运动参数估计时的精度。提出基于遗传算法的亚像元参数估计方法,数值实验结果表明了该方法的有效性,同时对图像配准参数估计算法对噪声干扰的稳健性通过实验进行了讨论。

期刊

亚像元配准频率域算法互信息遗传算法超分辨率重建sub-pixel registration frequency domain algorithm

一种分散接入集中认证网络计费系统的解决方案

本文总结了网络计费系统的发展应用情况,对新一代网络计费模式进行了探讨,并给出了一种基于RADIUS的分散接入集中认证计费系统的解决方案,克服了单个网络接入认证计费系统的不足,极大地提高了系统的管理能力,适应了电信级网络运营商的需求。

期刊

网络计费系统认证计费网络接入解决方案电信级RADIUS计费模式发展应用新一代网络网络运营商network billing system R

基于Web日志挖掘的Web文档聚类

其他学术论文