基于Hadoop的全球变化因子模型计算的研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zhaochunyang2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,利用遥感技术进行全球变化的监测和预防已成为一种普遍方式,基于遥感技术的原理,构建了针对不同应用的全球变化因子模型。这些模型通常利用多平台、多时相、多尺度、多波段的多源遥感影像进行计算,数据可能遍布全球各地,数据量可达到TB级甚至PB级,从而带来了全球变化领域的数据密集型计算问题。然而,目前,数据密集型计算的方法对地学应用还没有普遍的适用性,存在着数据存储分布不合理、并行化编程困难以及大数据量吞吐性能差等问题。因此,本文的研究目标在于研究实现分布式数据密集型计算的可用方法,实现海量分布的遥感数据的高吞吐的分布式计算。  针对以上问题,本文调研了云计算技术以及国内外的基于云计算的典型遥感影像处理平台,研究其所用的文件系统、计算模型等关键技术,云计算技术中,以Google云计算技术最为出名,而Hadoop是Apache组织对Google云计算思想的开源实现。目前,Hadoop已经在各个领域中得到了广泛的应用,并取得了很多研究成果。另外,本文分析了全球变化因子模型计算过程中的遥感数据以及算法的特点,从计算角度来看,全球变化因子模型计算过程大多是像素级遥感图像处理算法。基于以上分析,本文选择Hadoop云计算平台为实验平台,研究全球变化因子模型在Hadoop中的应用问题,具体而言,就是研究海量分布式的遥感数据在Hadoop中统一的计算流程和并行程序设计方法。  遥感数据的存储和组织方式比较复杂,而MapReduce计算的输入数据格式不直接支持遥感数据,然而,考虑到在HDFS中添加支持遥感数据的输入格式比较困难,文中选择在HDFS之外,对遥感数据进行数据格式转换操作。根据像素级遥感图像处理算法中的点运算、局部运算和全局运算三类算法特点,结合HDFS的存储以及MapReduce计算特点,分别研究并给出其与MapReduce并行编程模型的映射关系,从而提出对应的并行程序设计方法,并最终提出了基于Hadoop的具有普适性的海量像素级遥感图像处理流程。另外,针对MapReduce这种数据并行计算模型,以最大程度本地化计算为目标,针对遥感图像处理算法中不同的遥感数据访问模式,提出了按波段、按行和按块的数据划分方法。最后,对作业执行相关的Hadoop关键系统参数的配置优化进行了研究。通过大量实验表明,本文中提出的基于MapReduce的像素级遥感图像并行程序设计方法在Hadoop分布式环境中,随处理的数据量的变化表现出良好的可伸缩性;对Hadoop运行任务的map任务并发个数参数的调优,有助于提高map阶段的任务执行效率。  本文提出了基于Hadoop的海量像素级遥感图像处理流程以及像素级遥感图像处理算法中的三类算法与MapReduce并行编程模型中的映射关系,其关键技术与方法具有一定的通用性,对于从事其他包含像素级遥感图像处理算法的全球变化因子模型计算的其他科研人员来说,具有普遍的适用性和重要的借鉴意义。
其他文献
滇池流域是云南省人口最集中、土地开发强度最大、经济最发达的地区,为云南省和昆明市经济社会发展的核心地带,集中了全市55%的人口、80%的生产总值,人口密度是全市的四倍。随着社
合成孔径雷达(SyntheticApertureRadar,SAR)技术经过半个多世纪的发展,已经从单频率、单极化步入多频率、全极化时代。极化干涉从理论和应用上都已经得到了充分的发展,并应用于
随着城市的不断发展,发展城市文化产业成为城市未来重要的发展方向,是建设资源节约型社会的重要体现,也是实现中国梦的重要途径之一。构建城市文化产业的评价体系一直是城市产业
从工业革命开始,人类活动逐渐成为影响全球环境变化的重要力量,虽然温室气体排放和气候变暖在以往的研究受到大量关注,然而活性氮(Nr)排放对全球生态环境的影响也日益显现。高山
大家肯定要问:党中央五中全会最精髓的思想是什么?我觉得,用概括的语言来讲,有四大要点:把发展作为主题,把结构调整作为主线,把改革开放和科技进步作为动力,把提高人民生活
本研究选题来源于“云南省生态环境十年(2000-2010年)变化遥感调查与评估”项目。依据项目的要求,为了提高环境信息的管理水平,提高生态评价日常工作的质量和效率,使生态环境评价
1997年,古浪县黑松驿乡司法助理员侯殿禄以自己突出的工作成绩和为群众排忧解难的优秀事迹,荣获全国模范公务员、全国司法行政系统一级英雄模范、全国十佳基层法律服务工作
湿地被誉为“地球之肾”,是连接水陆的重要生态系统。鄱阳湖湿地具有丰富的生物多样性,是世界上最重要的湿地之一,也是具有全球意义的生态宝库。近年来,在全球变化以及人类活动共
拓扑关系、方向关系和距离关系是GIS空间关系的基本内容,也是空间数据查询、组织、推理和分析的基础,是空间信息科学研究的一个重点和热点。拓扑关系是空间数据的重要特征之一,
新疆段是丝绸之路文化线路遗产的精华部分之一,但是,由于文化线路遗产属于新列入的遗产类型,目前,尚没有一处成功申报的范例。文章归纳总结了全球已列入世界遗产名录的15处线性文