一种基于动态调度的数据挖掘并行算法

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:nxf_2004_0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  数据挖掘并行算法,应该以不牺牲挖掘效率和挖掘质量为前提。通过对数据挖掘原理和并行化的深入研究,在考虑到挖掘效率,负载平衡,运行环境,节点状态等多方面因素的基础上,提出了一种新的基于动态调度的数据挖掘并行算法,该算法以规模较小的子数据集为并行挖掘单元,各个并行单元之间采用全局通讯模式—Master-Worker模式来进行互相通信,降低了并行挖掘的通信成本,提高了挖掘的效率,缩短了挖掘的时间,同时该算法对不断变化的节点状态适应能力强。最后,实验结果验证了该算法的有效性以及在大数据集挖掘应用中的优越性。该算法不但保证了挖掘结果的正确性,而且具有较高的加速比。
其他文献
  学科研究热点对科研工作者具有重要的指导作用。常规的学科研究热点检测方法面临检测成本高、检测信息相对滞后等问题。为此本文提出一种基于学术会议征文的学科研究热点
  传统虚拟机调度算法未充分考虑并行任务的执行效率问题,当多个虚拟机联合执行并行计算任务时,虚拟机管理器仍采用时分复用方式分配物理CPU(PCPU),导致并行任务串行化,效
会议
  开发了一个高效率和易扩展的基于GPU(图形处理单元,Graphic Processing Unit)的并行分子动力学模拟程序.程序能够在GPU 上处理固相共价晶体中原子间的多体相互作用.通过
2005年是抗日战争暨反法西斯战争胜利60周年,郭岭梅被大量媒体“揪”了出来,因为她是俊华日军细菌战纪录片《不只是“731“》的编导。也由此,记者得知1950年出生的她竟是诗人
  通过将Orthodir(m)算法两个向量内积改成几个连续内积,改变算法数据相关性,提出了改进的Orthodir(m)算法(IOrthodir(m)算法)。改进的算法具有与原算法相同的收敛性。理论分
  稀疏矩阵相乘是在科学和工程计算中有广泛应用,是科学计算中的一种常用的基本运算。但也面临着数据量大,非零值分布不规则,负载难均衡,计算结果矩阵的列指数无规则分布等问题
生长后期研究不同抗寒性的葡萄品种叶片中氧化酶(CAT、POD、SOD、ASAPOD)活性及变化规律表明:抗寒性强的品种酶活性高,抗寒性差的品种酶活性低,且随着气温的下降而下降,以抗寒性强的品种变化得慢,抗
本文报道了黄埔港1992~1994年来自疫区船舶卫生检查结果。3年来自疫区中外籍船舶共730艘,其中中籍船舶222艘,占30.41%;外籍船舶508艘,占69.59%。中外籍船舶发现有鼠、虫、蝇、蚊
  理论证明蒙特卡洛模拟法能够精确估计汇率的VaR,但此方法计算量较大,实际中较难运用。在CUDA平台下利用GPU加速运算能很好的解决海量数据运算问题。在此假设汇率基本服从
  资源分配方法和技术一直是云计算领域中的热点问题。针对一定的用户任务,如何选择最合适的计算资源,使用户需求得到最大程度的满足,已成为决定云计算技术商业前景的关键。现
会议