Spark数据倾斜问题研究

来源 :河北省科学院学报 | 被引量 : 0次 | 上传用户：liaoyongsheng123

【摘要】

：

当今人类已经进入大数据时代,海量数据处理已成为大数据技术领域的研究热点。Spark是一种典型的基于内存的分布式大数据处理框架,但在Spark的实际应用中出现的数据倾斜问题会

【作者】

：

张占峰王文礼耿珊珊贾芝婷

【机构】

：

河北经贸大学信息技术学院

【出处】

：

河北省科学院学报

【发表日期】

：

2020年1期

【关键词】

：

大数据 SPARK 数据倾斜数据处理 Big dataSparkData skewData processing

【基金项目】

：

2019年度河北省研究生创新资助项目(CXZZSS2019106)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当今人类已经进入大数据时代,海量数据处理已成为大数据技术领域的研究热点。Spark是一种典型的基于内存的分布式大数据处理框架,但在Spark的实际应用中出现的数据倾斜问题会对计算效率产生重要影响。本文针对于Spark在各类应用中出现的数据倾斜问题,梳理国内外相关研究进展,对在出现数据倾斜问题后常用的优化方法进行了分析对比,最后对未来的研究方向进行了展望。

其他文献

针刺为主治疗偏头痛48例

偏头痛是由于血管舒缩功能障碍引起的，以头部发作性疼痛为主表现的一种常见病。其病因复杂，多见于青年人，疼痛的部位多见于一侧或双侧颞部，伴恶心呕吐，畏光，畏声和视觉紊乱等症状，是临床常见病，多发病，属于中医学“偏头风”，“脑风”，“头痛”范畴。2004～2010年以针刺为主治疗偏头痛患者48例，颇有心得，现报告如下。　　资料与方法　　本组患者48例，女35例，男13例；年龄18～55岁；病程1个月～1

期刊

偏头痛患者治疗针刺血管舒缩功能障碍恶心呕吐常见病发作性青年人

分享发展视野下农民工劳务派遣的问题与对策研究

时至今日劳务派遣已经在农民工务工中占据主要地位,研究分享视野下农民工劳务派遣问题与对策对农村经济发展与城镇化建设具有基础意义。本文通过对农民工劳务派遣的发展源流

期刊

分享发展农民工劳务派遣同工同酬

农地整治中农民利益受损与保障机制研究

农民持久且有保障的土地使用权是在新农村建设的新阶段被给予的,其不仅对农村的长远发展有保障作用,更保证了农村在发展过程中的稳定性。本着这一基础,势必要对农村土地进行

期刊

农村农民保障机制

甘肃机械工业50年：国庆50周年纪念

甘肃机械工业在甘肃经济建设中的地位举足轻重，做出了巨大贡献。通过回忆总结，展示了甘肃机械工业发展的历程和今天的规模。

期刊

甘肃机械工业

氢在Zr(Cr,Fe)2第二相晶体中扩散的第一性原理研究

采用基于密度泛函理论的第一性原理方法,计算氢原子在Zr(Cr,Fe)2(Fe/Cr=1∶7)晶体中的稳定间隙形成能.采用基于过渡态搜索理论的CI-NEB(climbing image nudged elastic band)

期刊

第一性原理Zr(CrFe)2晶体间隙形成能扩散first-principlesZr(CrFe)2 second phase crystalsinte

高掺量SBS改性乳化沥青的制备

为了提高SBS在改性乳化沥青中的掺量,从而提升其性能,本研究自制SBS胶乳作为改性剂,采用一边乳化一边改性的方法制备高掺量SBS改性乳化沥青.实验可得,SBS胶乳固含高达52.2%,

期刊

SBS胶乳高掺量SBS改性乳化沥青道路养护SBS emulsionhigh contentemulsifying asphalt with SBS mo

智能加工中切削刀具状态的在线监控方法及其发展趋势

对目前在智能自动加工中应用传感器技术以实现刀具状态在线监控的各种方法进行了较全面的阐述，并且指出了目前监控技术的发展趋势。

期刊

在线监控传感器信息融合智能加工刀具

蜂群自组网双信道频率分集多址接入协议

提出了一种适于大规模蜂群自组网的双信道频率分集媒质接入控制(DCFD-MAC)协议。信道预约与数据分组传输分别在控制信道(CCH)与业务信道(DCH)进行,避免信道预约与数据传输碰

期刊

蜂群自组织网络媒质接入控制频率分集隐藏终端与暴露终端Swarm ad hoc networksMedium access controlFrequenc

电感耦合等离子体质谱法测定盐酸丙帕他莫中12种金属杂质元素

建立微波消解电感耦合等离子体质谱(ICP-MS)法同时测定盐酸丙帕他莫药品中铅(Pb)、镉(Cd)、汞(Hg)、钴(Co)、钒(V)、镍(Ni)、砷(As)、锂(Li)、铜(Cu)、锑(Sb)、镁(Mg)、铝(Al

期刊

盐酸丙帕他莫电感耦合等离子体质谱仪(ICP-MS)12种金属元素propachomol hydrochlorideinductively coupled

基于MATLAB的6R机器人逆运动学求解分析

本文通过D-H方法建立6R机器人坐标模型,将机器人末端执行器位姿~0T_h逆解问题转化为末端腕部点位姿~0T_6的逆解问题,排除~0T_h中含常量d_6的多项式,大大简化了求运动学逆解的

期刊

6R机器人逆运动学反变换法最短行程关节运动同向6RrobotInverse kinematicsCounter transformation meth

Spark数据倾斜问题研究

其他学术论文