Spark和Flink平台大数据批量处理的性能分析

来源 :中国电子科学研究院学报 | 被引量 : 0次 | 上传用户：BENLAOQIAN

【摘要】

：

为了研究Apache Spark和Apache Flink两个框架在进行批量大数据处理时的性能差异和相似性,分析Spark和Flink的引擎差异,重点对比了两个框架在运行机器学习算法的细节。比较的

【作者】

：

马黎

【机构】

：

武汉大学计算机学院,商丘职业技术学院学报编辑部

【出处】

：

中国电子科学研究院学报

【发表日期】

：

2018年2期

【关键词】

：

批量大数据处理性能差异 APACHE SPARK APACHE Flink 机器学习算法 batch processing of big data perfo

【基金项目】

：

河南省教育厅高校重点科研课题（16B120003）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了研究Apache Spark和Apache Flink两个框架在进行批量大数据处理时的性能差异和相似性,分析Spark和Flink的引擎差异,重点对比了两个框架在运行机器学习算法的细节。比较的算法有：支持向量机（SVM）算法、线性回归（LR）算法和分布式信息理论的特征选择（FS-DIT）算法,其中SVM和LR算法为平台固有算法,FS-DIT根据平台框架特点重新设计。三种机器学习算法的实验结果表明：Spark的性能优于Flink,且总体运行时长低于Flink。另外对Spark目前拥有的MLlib和ML性

其他文献

辛酸的笔触动人的形象——简论李寿川的悲剧命运

【正】谌容同志的中篇小说《献上一束夜来香》(载《花域》一九八七年第一期),以饱含辛酸的笔触和对人物深刻的心理分析,揭示了当前在改革、开放、搞活的浪潮冲击下,人们精神

期刊

夜来香悲剧命运改革主体意识思想性格办公室心理分析开放机关工作笔触

在突发事件报道中打造媒体公信力

近年来,随着媒体发展,突发事件报道经常性跃入人们眼帘。本文试以汶川、玉树大地震抗震救灾中新闻媒体的报道为切入点,从抢夺话语权、树立权威性、提升竞争力等方面对媒体公

期刊

突发事件媒体公信力

略论生产力标准和实践标准的相互关系

【正】党的十三大提出了关于生产力标准的问题,这不仅在理论上丰富和发展了马克思主义,而且对于进一步解放思想,把改革引向深入具有重大的现实意义。什么是生产力标准?党的

期刊

生产力标准实践标准发展生产力生产力发展历史唯物主义生产关系马克思主义上层建筑社会主义根本标准

地域民俗与环境——论韦编联小说的“民族环境”描写

【正】韦编联同志是我区新崛起的一个中年作家。他从事创作的时间不长,但成果是扎实的。小说集《七色人生》(广两民族出版社1988年出版)收入他1982——1987年间所写中短篇小

期刊

民族特色生活环境民族作家民族风味生活场景中短篇小说环境描写民俗思想状况文学作品

同门较量：奥林巴斯μ740/μ750数码相机

μ740和μ750这两款奥林巴斯（DLYMPUS）最新卡片机外观几乎一模一样。两款DC都使用了1/2.3英寸的710万像素CCD和21.5万像素的2.5英寸LCD取景屏，并且都配备了一支36mm-180mm的5倍

期刊

奥林巴斯μ740/μ750数码相机10万像素光学防抖变焦镜头LCDCCD感光度

基于异源图像引导的红外图像增强算法

红外成像技术具有隐蔽性强、环境适应能力强、可探测隐蔽物体的优点,因此被广泛应用于军事等领域。受成像原理、硬件设备及环境等因素影响,导致的红外图像整体对比度低、细节模糊、噪声多、视觉效果差等特性,限制了红外图像应用范围。本文利用红外图像自相关性与可见光图像自相关性判断红外图像与可见光图像相关性;并利用红外图像与可见光图像相关性增强红外图像细节信息。实验结果表明,基于异源图像引导的红外图像增强算法,在

期刊

异源图像红外图像图像增强heterogeneous image infrared image image enhancement

粉字诀：解读联想手机2006年度秋季新品

如果你还以为“粉”字仅仅用来表达色彩，那么我只能说你落后了。对于现在的年青人来说，“粉”字诀已经实实在在地成为了他们全新的口头形容词：“粉好看”、“粉好玩”、“粉好用

期刊

联想手机新品发布会国产手机形容词

漫论青年大学生的人生观教育问题

【正】江泽民同志1990年在首都青年纪念五四报告会上的重要讲话,深刻阐述了爱国主义和我国知识分子的使命,深情表达了党对我国知识分子,特别是青年知识分子的殷切期望。当代

期刊

人生观教育青年学生青年大学生青年知识分子有中国特色社会主义为人民服务马克思主义哲学资产阶级自由化思潮社会实践

LTE室内场景下基于RNTP的协作资源分配算法

在长期演进系统（Long Term Evolution,LTE）室内场景下,可针对小区中心用户群和边缘用户群,通过动态波束赋型的方式形成相应的专属天线下倾角。本文以最大化系统的总吞吐量为目

期刊

长期演进系统室内场景下倾角功率时频资源块三维相关窄带传输功率LTE Indoor Scenarios Downtilts Power RB

手机的营养膳食：创见80×minSD存储卡

随着手机娱乐功能的日趋丰富，什么MP3歌曲、图片、视频文件常常会让我们的存储空间捉襟见肘。minSD卡作为手机存储扩展的一个主要途径，被广泛运用于诺基亚（NOKIA）、摩托罗拉（MOTOR

期刊

SD存储卡手机MINISD卡MOTOROLAMP3歌曲NOKIA娱乐功能

Spark和Flink平台大数据批量处理的性能分析

其他学术论文