【摘 要】
:
开发了一个基于云计算的并行分布式大数据挖掘平台——PDMiner。PDMiner实现了各种并行数据挖掘算法,如数据预处理、关联规则分析以及分类、聚类等算法。实验结果表明,并行分
【机 构】
:
中国科学院计算技术研究所智能信息处理重点实验室
【基金项目】
:
国家自然科学基金(61175052、61203297);国家高技术研究发展(“863”)计划(2013AA01A606、2012AA011003);国家重点基础研究发展(“973”)规划(2013CB329502)
论文部分内容阅读
开发了一个基于云计算的并行分布式大数据挖掘平台——PDMiner。PDMiner实现了各种并行数据挖掘算法,如数据预处理、关联规则分析以及分类、聚类等算法。实验结果表明,并行分布式数据挖掘平台PDMiner中实现的并行算法,能够处理大规模数据集,达到太字节级;具有很好的加速比性能;实现的并行算法可以在商用机器构建的并行平台上稳定运行,整合了已有的计算资源,提高了计算资源的利用效率;可以有效地应用到实际海量数据挖掘中。在PDMiner中还开发了工作流子系统,提供友好统一的接口界面方便用户定义数据挖掘任务。
其他文献
目的:探索帕罗西汀在慢性失眠症的治疗中是否有效,并比较帕罗西汀与艾司唑仑治疗慢性失眠症的临床效果。方法:74名慢性失眠患者,随机分成2组,分别接受帕罗西汀与艾司唑仑治疗
利用鸡胚试验技术研究了阔叶十大功劳根中生物碱成分在体外对流感病毒的抑制作用。试验结果表明,阔叶十大功劳根中生物碱成分在20mg/ml时对鸡胚无毒性,0.25mg/ml时仍显示出对
目的 :探讨大学生社交焦虑易感性与各种可能因素之间的关系。方法 :对 2 0 0名大学本科生施测了社交焦虑量表、羞耻量表、艾森克人格问卷简式量表、应付方式问卷、贝克抑郁量
针对二次型最优控制调节器难以实现对二级倒立摆系统的最优控制问题,本文建立了倒立摆数学模型,并对直线二级倒立摆(线性二次型控制器)(linear quadratic regulator,LQR)进行
以投资者的投资心理为基础,建立了基于过度自信心理的风险溢价模型,运用此模型建立了基于亏损概率的套利风险模型和基于期望损失的套利风险模型,研究了套利的有限性和投资心
<正>一、引言《了不起的盖茨比》非浩瀚巨制,仅五万余言,却能列入"20世纪美国最佳的12部小说之一"。笔者认为一个很重要的原因就是作家以一个青年人的追求与幻灭来解构美国梦
[目的]观察中药熏蒸联合针刺治疗黄疸型乙型肝炎疗效。[方法]使用随机平行对照方法,将60例住院患者按抛硬币法简单随机分为两组。对照组30例甘草酸二胺150mg+10%葡萄糖250m L
对于网络安全来说研究黑客技术从长远的角度看是有利的,因为黑客技术是客观存在的,如果我们不去了解和研究它,则会受制于它.在信息技术越来越发达的今天,我们需要开发自己的
乌鞘岭特长铁路隧道在工期要求、辅助坑道数量及其布置形式上有其自身特点 ,同时在施工过程中体现出不同的阶段性特点。依据这些特点 ,并考虑到实际中所遇到的其他因素 ,经过