Genetic Algorithms for Auto-Clustering in KDD

来源 :系统工程与电子技术 | 被引量 : 0次 | 上传用户:mqz614005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
In solving the clustering problem in the context of knowledge discovery in databases (KDD), the traditional methods, for example, the K-means algorithm and its variants, usually require the users to provide the number of clusters in advance based on the pro-information. Unfortunately,the number of clusters in general is unknown to the users who are usually short of pro-information.Therefore, the clustering calculation becomes a tedious trial-and-error work, and the result is often not global optimal especially when the number of clusters is large. In this paper, a new dynamic clustering method based on genetic algorithms (GA) is proposed and applied for auto-clustering of data entities in large databases. The algorithm can automatically cluster the data according to their similarities and find the exact number of clusters. Experiment results indicate that the method is of global optimization by dynamically clustering logic.
其他文献
本文基于现代社会背景下高校办公档案服务含义的基础之上,阐述了高校办公档案社会化服务的主要优势,分析了目前高校办公档案社会化服务存在的问题,最后针对具体问题提出了高
《档案学论衡》是档案学的一部上乘之作,本文从《档案学论衡》一书中的档案学发展的内部协调论及档案学共同体的建设展开,以期对档案学术共同体建设有所了解,促进档案学的科
Time series data of dam security have a large number of observed values and should be forecasted accurately in time.Neural networks have the powerful approach a
利用全量子理论,研究非旋波近似下T-C模型中受激场的压缩效应.结果表明:非旋波近似下,由于虚光场的影响,Q的演化曲线出现了"小锯齿状",表现为系统的量子噪声,随着ω和的增大,
针对多指标方案排序选优决策问题 ,提出了一种基于时间矩阵序列的方案综合排序分配法。假设存在一个“隐评价函数”,它能对方案的各种优先排序进行综合评价 ,由此得到方案的
随着地面与地下空间的综合开发利用日愈增多,地面建筑与地下建筑的冲突也日愈突出,其核心问题是围岩的承载能力,本质是围岩稳定性问题.研究围岩稳定性的方法主要有传统计算方
通过分析拟线性系统的稳定性 ,得到了一类拟线性脉冲控制系统渐近稳定的一个充分条件 ,由此为这类系统设计了脉冲控制器 ,解决了这类拟线性系统的镇定问题 ,进一步分析了这类
针对多智能体的复杂系统模型,运用多线程技术,提出了智能体线程模型,建立了基于多智能体线程 模型的复杂系统实时模拟模型,并对多线程技术在多智能体复杂系统模型计算中的应用进
目的:评价某院住院患者注射用盐酸纳洛酮的应用情况,并分析其应用合理性。方法:利用“医信通”电子病历质量监控与维护系统,对该院2012年10~12月住院患者医嘱中含注射用盐酸
含量只是一种对混合物组成的模糊的表达形式,定量描述时,要区分为分数、比和浓度分别表示.含浓度的量要根据具体情况使用全称,而不要一律简称为浓度.针对科技期刊中常出现的