基于自组织映射的多维数据集的可视化及聚簇分析

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户:xiaorixue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多维数据集的可视化的主要困难是难以用传统的图形方法表达多维空间。本文从人工神经网络的自组织映射算法出发,介绍了基于SOM的可视化及聚簇方法,并得到以下结论:(1) SOM作为一种矢量量化方法,用它可把原始采样值量化为SOM原型矢量集,从而可有效地压缩数据。(2) SOM实际上是原始采样值的一个拓扑相似映射,它为原始数据集的可视化提供了新的思路和算法.(3)SOM矢量网格图形在实现可视化的同时,也同时完成了聚簇分析,为可视数据挖掘提供了新的方法。(4)本文用Visual C++语言实现了SOM算法,并给出了若干数据分析的结果。
其他文献
在大多数实际问题中,机器学习的成败很大程度上取决于学习方法的噪音处理能力。本文介绍了基于可变精度粗集的规则简化方法。实验结果表明,采用GMM规则简化方法对决策树规则进
本文提出改进的语言值关联规则挖掘算法。改进的算法在发现大语言值属性集时采用类似布尔型属性快速算法中发现大属性集的方法,能处理属性数量较多的情况,克服了组合方式发现规
关系规则是数据发掘中非常重要的研究领域,为了从数据库中挖掘出更多更有效、更有价值的规则,本文对关联规则的结果进行了模糊化。
本文研究了一种应用粗集理论的数据方法,给出了挖掘模型和算法,最后,通过一个实例证明了该方法的有效性和实用性。
近年来,从大量的历史数据中发现和提取有价值的知识成为人工智能的一个新的领域,其研究主要集中在分类、聚类和关联等方面,近年来有关时态约束的KDD研究成为热点之一,国内外
挖掘关系规则是数据挖掘中的热点问题。本文研究了基于交互式模式分解的关联规则发现算法,它根据频繁集和非频繁集的个数,对事务项集进行分解,从而求得全部频繁集,其优点在于:(1
本文首先系统分析了当前数据仓库建设过程中数据迁移遇到的困难,在此基础上,提出了一种解决专用数据抽取、转换、加载(ETL)工具和实现程序集成的支撑框架。应用该ETL支撑框架,可
为充分利用客户这一重要的资源,许多企业正在引进和实施CRM,即客户关系管理.CRM是一种新的管理理念和管理机制,也是一种管理信息系统和软件技术,它综合了数据仓库、数据挖掘
会议
本文介绍了并行数据仓库系统ParaWare的整体设计思想,包括它的三层体系结构,多维分块数据存储方法,MDX查询处理及优化策略,基于数据块的两层缓存技术,预计算方法,断点续算功能和安
目的了解恩施和武汉地区手足口病(HFMD)的分子流行病学特征和病原体柯萨奇病毒A16型(CA16)VP1的基因特征。方法收集2010年4月至2011年8月来自于恩施和武汉地区的189例HFMD患