K-means聚类算法的研究和应用

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:suna_lili82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍了K-means算法的思想,分析了在文档聚类中运用K-means算法的步骤。以开源的机器学习软件Weka为平台,详细论述在Weka上进行文档聚类的前端处理过程,利用搜狗语料库中的文档在Weka上进行了Kmeans算法的聚类测试。实验结果表明,K-means算法在Web文档聚类中表现出较好的效果。根据实验结果,分析了K-means算法存在的不足和聚类分析中特征选择的重要性。
其他文献
热处理炉炉温的自动控制采用可控硅实现无触点控制,可显著提高电气设备运行的可靠性,是减少维护工作量、维修费用和保障产品质量稳定提高行之有效的方法。
网络监控技术不但是一项重要的技术,也是安全领域内一个非常敏感的话题,具有很强的现实意义。介绍了网络监控技术的原理和实现意义,讨论了监控技术在Windows下的多种实现,并介绍了在Win32环境中利用Winpcap开发包开发网络实时监控程序,给出了具体的设计与实现方法。
<正> Galfan 是国际铅锌研究组织八十年代开发出来的,用以代替热镀锌的新一代防腐镀层,其成分为含有少量稀土金属的锌和铝(5%重量)的共晶体。现已试验成功了两种Galfan 的镀
随着计算机技术的普及,大量传统行业开始通过计算机进行信息管理。为了解决政府信息数量庞大,人工管理困难且容易出错,采用最新的SOA技术构建了政府信息管理系统。对SOA技术
<正> 1.问题的提出锌锅工频感应加热是国内一种比较先进的锌锅加热方式。其特点是使用寿命较长,维修费用较低,能耗省。我厂30吨锌锅用六台30千瓦感应器熔沟,以往十个月至一年
介绍了Web站点动态内容缓存的几种方法,包括smarty缓存、内存缓存、服务器缓存。使用并发压力测试对这几种方法做了使用缓存前后的性能提升的纵向比较,以及各项方法对性能提
结合工作实践,详细讲解了Linux系统下Mongo数据库的快速部署及环境配置.