基于浓密树和改进McCHyp算法的Impala查询优化

来源 :第二届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:xiaoshuishe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Impala大数据实时查询系统在查询优化上存在的问题,提出基于浓密树和改进的McCHyp(MinCutConservative Hypergraph)算法的Impala查询优化方法.首先,修改Impala使其支持浓密树的查询计划;接着,使用剪枝策略对McCHyp算法进行改进,减少查询优化的时间;最后,提出一种适用于Impala的代价模型,并将改进的McCHyp算法集成到Impala中,根据用户的SQL语句生成较优的查询计划.在Impala系统上实现了本文提出的查询优化方法并在TPC-H数据集上进行了实验,结果表明,改进的McCHyp算法与McCHyp算法对连接超图的优化结果一致,且前者的运行时间减少了43.82%~62.55%.同时,使用改进的McCHyp算法及新的代价模型对查询语句优化后,查询响应时间较原始的Impala系统减少了79.60%.
其他文献
大数据集成是提供高质量数据进行决策的基础.集成的一个关键环节是根据实体在数据库中的不同元组确定其准确属性值.最新的R-topK方法在数据上实施人工设计的规则确定属性值间
会议
由于受到新型冠状疫情的影响,各高校无法正常返校开展线下教学活动,为了积极响应党中央的号召“停课不停教,停课不停学”,工程结构抗震与防灾课程正式开启长江雨课堂线上直播
国务院总理温家宝6月1日主持召开国务院常务会议,决定启动城镇居民社会养老保险试点。会议决定,自2011年7月1日起,启动城镇居民社会养老保险试点工作,今年试点范围覆盖全国60
我对写实水墨人物画有两点看法,说出来与大家探讨交流,希望不犯什么忌讳。1、写实水墨人物画的历史满打满算只有几十年,技术成熟和创作高峰是在新中国成立以后,这一时期产生
近几年来,大数据机器学习和数据挖掘的并行化算法研究成为大数据领域一个较为重要的研究热点.早几年国内外研究者和业界比较关注的是在Hadoop平台上的并行化算法设计.然而, H
会议
本文在全面开展的建设统一坚强智能电网背景下,针对配网电缆化率日益增高,未来电力系统面貌可能发生的重大变革,尤其是在集成了现代工程技术、高级传感和监视技术、信息与通
会议
在努力实现本土化的国际文化战略浪潮中,韩国的传统家具以其简洁优雅的特点,越来越受到国际工艺美术界的重视。韩国是深受中国传统文化影响的国家,在19世纪,儒家文化渗透到韩
在全面建设"三集五大"体系的新形势下,如何尽快解决市县公司工作不同步、县公司管理基础薄弱等问题,是加强市县一体化管理面临的重要课题.潍坊公司自2013年按照"子公司体制、
会议
按照坚强智能电网建设的总体要求,保证智能电网建设规范有序推进,茌平电网实现了电力用户用电信息采集系统全部覆盖,用电信息采集系统在客户错峰管理、营业抄表、计量监测、
中压配电系统中性点接地方式的正确选择是电网安全、可靠运行的保障.本文首先介绍了国内中压配电系统中性点接地方式概况,随后对中性点不接地、中性点经消弧线圈接地和中性点
会议