基于SOM的海量数据挖掘的研究

来源 :中国人工智能学会第10届全国学术年会 | 被引量 : 0次 | 上传用户:knik120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将SOM作为海量数据挖掘中的通用数据压缩算法,实现了对数据的有效压缩,使经典数据挖掘算法能够应用于海量数据挖掘领域。分析了这一方法的基本思想,介绍了处理过程,并与类似算法做了比较。
其他文献
多示例学习为Web挖掘提供了一种全新的思路。如果把各大门户网站的结构和页面的组织方式看成是一种目录式的结构,目录页面所提供的信息由与之关联的内容页面来描述,则对目录页
现行基于特征码的病毒手扫描器发现不了未知的恶意可执行代码。本文针对未知的恶意可执行文件的榆测,对训练集的恶意可执行文件与正常可执行文件提取其机器代码的统计特征,发现
会议
本文综述了进化算法与人工神经络结合技术现状的研究,主要包括优化网络设计、输入数据预处理、网络集成等方面内容,并对研究过程中出现的主要问题及未来发展趋势进行了讨论。
本文应用序列挖掘方法对用户命令序列和特定行为序列进行分析,建立用户行为概貌和特定行为模型,并针对用户使用的高频命令序列,采用统计分析的方法对其进行独特性评价。实验结果
本文对有关粗糙集与神经网络相结合的研究现状、关键技术和发展趋势进行综述,主要内容包括:①粗糙集用于数据预处理;②粗糙集用于神经元设计;③粗糙集用于神经网络结构设计。最后
随着数据挖掘技术的发展,更多的统计学习和人工智能的方法备用在了信用风险度量当中。论文应用支持向量机(SVM)这种新的统计学习算法,对中国上市公刊的财务失败进行了预测。研
知网是一个大规模语义知识库。它的字典库和义原库蕴藏了丰富的语义信息。本文利用知网的三类语义关系:上下位关系、静与动的对应关系、动态相互感应关系,对最基本的动词名词之
将基准作为判断操作的必备条件(或参量),本文提出了最简判断和初等判断的定性映射(Qualitative Mapping,QM)τp(x,S)模型,并指出集合论中的特征函数、(简单)医疗诊断、数据库中
C4.5具有处理不完整数据、连续属性等能力。Quinlan通过试验对比了多种方法处理不完整数据的有效性,并把最有效的方法应用到C4.5中,使C4.5具有较好的处理不完整数据的能力。本
本文在总结了几种多变量决策树的挖掘方法后提出了一种挖掘多变量决策树的新方法。这种方法利用一些启发式信息将属性合组合起来,作为当前结点的分类属性,得到了与C4.5算法相比