Spark和Flink平台大数据批量处理的性能分析

来源 :中国电子科学研究院学报 | 被引量 : 0次 | 上传用户:BENLAOQIAN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了研究Apache Spark和Apache Flink两个框架在进行批量大数据处理时的性能差异和相似性,分析Spark和Flink的引擎差异,重点对比了两个框架在运行机器学习算法的细节。比较的算法有:支持向量机(SVM)算法、线性回归(LR)算法和分布式信息理论的特征选择(FS-DIT)算法,其中SVM和LR算法为平台固有算法,FS-DIT根据平台框架特点重新设计。三种机器学习算法的实验结果表明:Spark的性能优于Flink,且总体运行时长低于Flink。另外对Spark目前拥有的MLlib和ML性
其他文献
【正】 谌容同志的中篇小说《献上一束夜来香》(载《花域》一九八七年第一期),以饱含辛酸的笔触和对人物深刻的心理分析,揭示了当前在改革、开放、搞活的浪潮冲击下,人们精神
近年来,随着媒体发展,突发事件报道经常性跃入人们眼帘。本文试以汶川、玉树大地震抗震救灾中新闻媒体的报道为切入点,从抢夺话语权、树立权威性、提升竞争力等方面对媒体公
【正】 党的十三大提出了关于生产力标准的问题,这不仅在理论上丰富和发展了马克思主义,而且对于进一步解放思想,把改革引向深入具有重大的现实意义。什么是生产力标准?党的
【正】 韦编联同志是我区新崛起的一个中年作家。他从事创作的时间不长,但成果是扎实的。小说集《七色人生》(广两民族出版社1988年出版)收入他1982——1987年间所写中短篇小
μ740和μ750这两款奥林巴斯(DLYMPUS)最新卡片机外观几乎一模一样。两款DC都使用了1/2.3英寸的710万像素CCD和21.5万像素的2.5英寸LCD取景屏,并且都配备了一支36mm-180mm的5倍
红外成像技术具有隐蔽性强、环境适应能力强、可探测隐蔽物体的优点,因此被广泛应用于军事等领域。受成像原理、硬件设备及环境等因素影响,导致的红外图像整体对比度低、细节模糊、噪声多、视觉效果差等特性,限制了红外图像应用范围。本文利用红外图像自相关性与可见光图像自相关性判断红外图像与可见光图像相关性;并利用红外图像与可见光图像相关性增强红外图像细节信息。实验结果表明,基于异源图像引导的红外图像增强算法,在
如果你还以为“粉”字仅仅用来表达色彩,那么我只能说你落后了。对于现在的年青人来说,“粉”字诀已经实实在在地成为了他们全新的口头形容词:“粉好看”、“粉好玩”、“粉好用
【正】 江泽民同志1990年在首都青年纪念五四报告会上的重要讲话,深刻阐述了爱国主义和我国知识分子的使命,深情表达了党对我国知识分子,特别是青年知识分子的殷切期望。当代
在长期演进系统(Long Term Evolution,LTE)室内场景下,可针对小区中心用户群和边缘用户群,通过动态波束赋型的方式形成相应的专属天线下倾角。本文以最大化系统的总吞吐量为目
随着手机娱乐功能的日趋丰富,什么MP3歌曲、图片、视频文件常常会让我们的存储空间捉襟见肘。minSD卡作为手机存储扩展的一个主要途径,被广泛运用于诺基亚(NOKIA)、摩托罗拉(MOTOR