【摘 要】
:
大数据时代的到来给传统的机器学习带来了许多挑战,在机器学习领域对大数据的处理主要使用开源框架Hadoop的MapReduce并行编程模型。许多机器学习算法能够用MapReduce并行化,
论文部分内容阅读
大数据时代的到来给传统的机器学习带来了许多挑战,在机器学习领域对大数据的处理主要使用开源框架Hadoop的MapReduce并行编程模型。许多机器学习算法能够用MapReduce并行化,如决策树、K-means、受限玻尔兹曼机(RBM:Restricted Boltzmann Machine)等。以RBM为例,用MapReduce实现RBM的并行化主要是解决大数据集训练RBM效率低,内存不足的问题。研究基于开源框架的大数据分类问题具有重要的理论意义和应用价值。本文研究了基于MapReduce和受限玻尔兹曼机的大数据分类问题,主要工作包括两部分:(1)关于MapReduce并行化机制的优劣,本文进行了比较研究,得出了一些有价值的结论。(2)在前一个工作的基础上,提出了一种集成RBM的大数据分类方法。该方法大致可分为两步,第一步用MapReduce框架并行训练多个RBM,即在云计算平台的多个结点上同时训练多个RBM;第二步用模糊积分集成训练出的多个RBM,并用于分类未见的数据。对提出的方法与相关的方法进行了实验比较,实验结果证明了提出的方法的有效性。
其他文献
近些年来,政府和社会资本合作(PPP)模式受到社会广泛关注,同时也受到从国家层面到地方各级政府的日益重视。自党的十八届三中全会召开以来,PPP模式已经成为政府及社会进行有
抗战初期,日本封锁中国东南沿海,南起越南海防,北到云南昆明的滇越铁路,迅即成了中国对外交通的生命线,中国从国外购买的各种物资,外国援助中国抗战的物资,海外华侨华人支援
<正>天宫:为中国空间站"奠基""天宫"家族有两位成员——天宫一号和天宫二号。2016年3月,天宫一号功成身退。6个月后,天宫二号升上太空,目前已经接待了两批"访客"——神舟十一
橡胶物证作为交通肇事及刑事案件中比较常见的物证和线索,倍受重视和广泛研究。利用衰减全反射红外光谱(ATR)对市面上几种主要类型轮胎橡胶进行了红外光谱测定、比照和分析,
国医大师郭子光教授临床六十余年,多遇奇疑难症,总能独辟蹊径,收获佳效。本文精选郭老辨治此类病证验案三则,并根据郭老自注按语或笔者侍诊记录,加以充实整理,以管窥郭老精湛
目的观察灸法治疗围绝经期综合征的临床疗效。方法将108例阳虚、阴虚体质围绝经期综合征患者随机分为治疗组56例和对照组52例。治疗组采用灸法治疗,对照组采用药物治疗。以国
中国女书是国家首批非物质文化遗产,是全世界现存唯一的性别文字。在漫长的历史岁月中,女书的出现象征着女性对平等、自由、智慧的追求,也是女性表现内心情感的表达方式。
基于 Reddy型高阶剪切精化理论 ,将力学分析中的 Rayleigh- Ritz法与曲面几何造型中的Bezier函数相结合 ,构造出分片的 Rayleigh- Ritz半解析解 ,获得了精度可控的轮胎内力、
<正>天宫,是中国载人空间站的名称。早在1992年,中国就确立了以建立空间站为目标的航天计划。第一步是载人飞船阶段,目标是能够把宇航员送到太空,正常运行若干天并成功返回;