论文部分内容阅读
今年以来我国连续发生严重自然灾害,人们开始思考一个问题:我们到底能否在灾害发生之前就能准确地预报它,制定出相关的应对方案?过去我们可能对这个问题束手无策,只能听天由命。但随着计算机技术的发展,我们在地面上就能通过超级计算机来对地球内外部运动而产生的变化进行计算,虽说还不能完全掌握这些变化规律,但是已经能帮助我们更好地来应对这些变化。
Part 1:从地球模拟器说起
“NEC地球模拟器”自问世以来就引起许多人的关注。几年前,由NEC为日本海洋科学技术中心打造的这台地球模拟器大型机以强大的运算能力连续两年占据着Top500超级计算机排行榜的榜首。虽然在今天看来,地球模拟器35.61 TFlops*的浮点运算能力也不过与几十块NVIDIA Geforce GTX 280显卡的运算能力相当,但在当时已经是非常厉害了。因为在2002年排名第二的IBM ASCI White-Pacific超级计算机也不过只有7 TFlops的浮点运算能力。1G=1024M、 1M=1024K , 这里的TFLOPS就是每秒运算能力为1兆=10的9次方,1TFLOPS等于1万亿次浮点指令。
和蓝色基因、RoadRunner这样拗口的超级计算机名字相比,地球模拟器不仅易懂,还富有强烈的科幻色彩。一部超级计算机,真的能模拟地球的一切运作吗?事实上地球模拟器所能做的,只是帮助人们模拟全球变暖问题,并且预测地球总体气候变化趋势而已,距离模拟整个地球的各个子环境运行仍然有着遥不可及的距离。但即便如此,把地球模拟器在1秒钟内完成的计算任务,交给一个人使用计算器来完成,却需要花上3000万年。毫无疑问,模拟天气变化仍然是当今庞大惊人的计算之一,我们每天看的天气预报背后实际上就是无数超级计算机连续运转的结果。
可是虽然当今最快的超级计算机IBM Roadrunner运算能力也已经达到1.026P Flops(千万亿次),但在Top500超级计算机排行榜中,仍然有大量超级计算机的运算能力,被天气变化和环境预测程序所消耗殆尽。可以预见,气候与环境的预测分析仍然是超级计算机们大显身手的领域。究竟气象与环境预测为什么需要如此惊人的计算能力?我们在多久的未来才能获得完全准确的天气预报甚至是地震警报?接下来请随我们一探究竟。
Part 2:气象模拟与预测:精确度与计算能力的较量
1.计算机在天气预报中起到的作用
天气预报自诞生以来就成了我们生活中不可或缺的重要元素。我们每天都会根据天气预报确定着装、是否带雨具等生活问题。如你所知,当今的天气预报仍然无法做到十分准确,无论是降雨还是气温都难以预报到百发百中。然而如今的天气预报,其实已经包含了无数科技上的巨大进步。
在过去我们只能使用天气图配合过去天气记录来进行预报。整个天气预报以天气图为主,配合卫星云图、雷达图等,用天气学的原理来分析和研究天气的变化规律,并通过概率统计总结出天气变化的统计规律来进行预报。而随着计算机科学的快速发展,当今的天气预报,除了运用上述手段外还引入了数值预报方法,即利用大型、快速的电子计算机求解描述大气运动的动力学方程组来制作天气预报。在这三种方法融合的情况下,天气预报的准确率已经大大提升。对于计算机来说,天气预报实际上是海量的方程求解,由于整个计算涉及大量方程组和变量,只要有细微的参数发生变化,整个结果就会完全不同。和其它科学计算相比,天气预测计算还有极强的时效性——面对瞬息万变的气候,也许大量参数在运行过程中就需要进行修正,天气预报更是在4~12小时内就会重新发布一次,这就意味着计算机必须在时限之内完成计算任务。
如果我们将获得的所有天气参数都交由计算机运算,那即便是Roadrunner也需要几天时间。为了解决时效性与精细度、精确度之间的矛盾,人们又构建了许多天气预报模型。当今我国使用的天气预报计算模型主要有国家气象中心中期数值预报业务谱模型(T106L19)、有限区域模式(HLAFS)、MM5模型以及WRF(Weather Research and Forecasting)模型等。其中T106L19和HLAFS模型一般只能用作中期(48~96小时)天气预报,而MM5模型则由美国宾夕法尼亚州立大学和美国气象研究所联合开发,适用于更精细尺度的短期天气预报。作为新一代的天气预测计算模型, WRF有着更准确的结果和区域性,但其计算量同样基于所有类型之首。在当今计算能力的限制下,我们一般只采用中尺度计算“颗粒”*(20~200km),而对于MM5和WRF来说精细度其实完全可以做到1km。
*注释:中尺度计算“颗粒”就是距离在20~200km之间的天气预报模型。颗粒是计算尺度/精度,20~200km之间为一个颗粒。
2.计算机可视化对气象预报的分析
那天气预报是如何在电脑上进行的?至此我们需要粗略了解一下什么是可视化计算。你可千万别以为我们当今玩的3D游戏、进行一些3D模型渲染就被称作可视化计算。事实上科学计算可视化(Visualization inScientific Computing)是发达国家在80年代后期提出并发展起来的一个新的研究领域。所谓可视化计算,是将科学计算过程中产生的数据及计算结果转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。随着技术的发展,科学计算可视化的含义已经大大扩展,它不仅包括科学计算数据的可视化,而且包括工程计算数据的可视化:如有限元分析的结果等;同时也包括测量数据的可视化:如用于医疗领域的计算机断层扫描(CT)数据及核磁共振(MRI)数据的可视化等等。
气象预报的准确性依赖于对大量数据的计算和对计算结果的分析。一方面,科学计算可视化可将大量的数据转换为图像,在屏幕上显示出某一时刻的等压面、等温面、位涡、云层的位置及运动、暴雨区的位置及其强度、风力的大小及方向等,使预报人员能对未来的天气作出准确的分析和预测。
另一方面,根据全球的气象监测数据和计算结果,可将不同时期全球的气温分布、气压分布、雨量分布及风力风向等以图像形式表示出来,从而对全球的气象情况及其变化趋势进行研究和预测。在当今气象预测机构中,许多都采用了将MM5、WRF模型导入可视化计算软件中进行计算的方法来预报天气。其中最为常见的可视化计算软件就是AVS/Express*。同样以地球模拟器为例,这部超级电脑在100km尺度的情况下需要3小时才能计算出目标地区的天气变化,如果将尺度缩小为10km,那计算时间更需要以天来计算。
*注释:AVS/Express是一个通用的,非常容易使用的数据可视化工具,不仅适用于有经验的开发者,而且适用于非程序开发者。对于任何需要数据可视化的任务, AVS/Express是最好的选择,它提供非常直观的图形应用开发环境,以及快速的数据分析和丰富的视觉技术。AVS/Express可以广泛应用在很多领域,包括科学,商业,工程,医疗,通信和环境研究等。
3.我国用于气象预测的计算机技术的发展
如今世界性的气候变化日益复杂,为我国气象预测和天气预报的准确度带来了新的挑战。从2007年开始,我国省市级的气象部门都逐步转向MM5和WRF气象预测模型的研究,相应的计算机也进行了全面的升级。北京市气象局就在2007年购买了IBM System P575超级计算机。新计算机的计算能力是北京市气象局之前系统的10倍。这台超级计算机除了按小时提供天气预报外,还将被用于预报北京的空气质量。北京市气象局将利用这台计算机提高北京周边地区天气预报的准确性。IBM的System P575采用了 Power5 处理器*,可以在单个节点提供8~16内核、1.9~2.2GHz的超高运算密度。
*注释:新的Power5 处理器被称为“片上服务器”, 是基于Power5处理器的增强版,包括2个处理器,一个高带宽系统交换器,一个更大的高速缓存和I/O界面。可使System P575为用户提供更强大的性能,而功耗更小。
除了北京气象局以外,各省市级的气象局所使用的计算机大多为x86集群。其中曙光天朝4000系列集群有着较高的占有率。该集群采用的该款计算机使用了2560个AMD公司的Opteron*处理器,拥有最大11 TFlops的浮点预算能力和最大42TB的存储容量。曙光4000A可以在1小时内,同时完成4次36小时的中国周边、北方大部、北京周边甚至到北京市的2008年奥运会所需要的气象预报计算,计算项目包括风向、风速、温度、湿度等,精度达到1km,即精确到每个奥运会场馆。
*注释:AMD Opteron(皓龙) 处理器是专为服务器与工作站而设计的集合32 位与 64 位计算优势的处理器方案。
Part 3:地震监测与分析:海量数据与带宽的博弈
1.地震监测的重要性
今年5月12日的四川大地震让我们充分认识到了大自然的破坏力,在灾难过后许多人都在思考地震是否能预报,或是如何将地震带来的损失减少到最低。虽然地震能否被预报到现在仍然是个极具争议性的话题,然而降低地震所带来的损失却有着大量切实可行的方法。而在这些方法背后,超级计算机强大的运算能力同样功不可没。
和气象预测有着明确的模型和分析,只需要进行复杂计算不同。降低地震的损失主要通过在地震后迅速发出通告为主要手段。由于地震波的传播需要时间,只要地震通报能快于地震波传递的速度,就有降低伤亡损失的可能性。如今我国整个国土上建造了大量用于测量地震的地震台,并将它们相互连接构成地震台网。每秒钟地震台都将会向数据中心返回海量的报告,要在尽可能快的时间内完成对返回数据的分析和挖掘,才有可能降低地震的伤亡。
2.我国用于地震研究的计算机技术发展
根据国家地震局工程力学研究所披露,用于进行科研的地震工程远程协同实验系统(Network of Earthquake Engineering Simulation)所使用的计算机采用了高密度刀片架构,拥有256个计算节点,浮点双精度运算理论运算峰值能力可达到 20 TFlops。在2007年,大庆油田公司勘探开发研究院的地震资料处理系统采用了692台HP BL20PG3、HP DL380G3和HP DL580G3服务器,拥有1432个Intel Xeon CPU,峰值浮点运算能力达到9.8 TFlops。成功跻身Top 500超级计算机排行榜。,
由于地震的能量会逐步从地壳释放至地面,所以我们的地震预警系统就可以探测到地壳内部最细微的地震波,然后根据设定发出警报。在绝大部分情况下,这些预警系统能提前15~30秒提供地震预警——这区区几十秒很多时候就是生与死的差别。因此在未来我们减少地震损害的最有效的方法,仍然是如何快速汇拢全国各地的地震台、感应器之间发回的数据,然后及早提供预警信号。这对于当前还相对有限的计算能力和数据传输带宽来说,仍然是个很大的挑战。
Part 4:地球计算,平民参与
虽然我们当今台式机上用的Core 2 Duo处理器,只有不到30GFlops的浮点运算能力,对于动辄以Tera计算的应用来说只不过是杯水车薪。可是如果能把地球上数以亿计的桌面电脑、笔记本电脑的运算能力“汇集”起来,就能获得惊人的浮点运算速度。
为了实现这个目标,全民参与的分布式计算活动被全面推广开来。首个分布式计算程序SETI@Home(在家寻找地球外智能生物)推出至今,已经借助平民的力量完成了几十PB*射电望远镜资料的分析和挖掘。而随后兴起的Folding@Home(蛋白质折叠分析)在SONY PS3、NVIDIA、AMD显卡以及大量台式机的助力下,已经拥有超过1 PFlops的处理能力。对于普通用户来说,只需要安装对应的客户端程序,在机器空闲时程序就会代替Windows屏幕保护贡献出自己的处理能力。
*注释:PB是PetaByte的缩写,是2的50次方,相当于1024TB。
结语
相信随着未来运算能力的几何级数提升,普通用户更多地参与到分布式计算当中,我们对天气与地震预测的准确性也将更高,那时我们更能感受到计算机带给我们的美好生活。
Part 1:从地球模拟器说起
“NEC地球模拟器”自问世以来就引起许多人的关注。几年前,由NEC为日本海洋科学技术中心打造的这台地球模拟器大型机以强大的运算能力连续两年占据着Top500超级计算机排行榜的榜首。虽然在今天看来,地球模拟器35.61 TFlops*的浮点运算能力也不过与几十块NVIDIA Geforce GTX 280显卡的运算能力相当,但在当时已经是非常厉害了。因为在2002年排名第二的IBM ASCI White-Pacific超级计算机也不过只有7 TFlops的浮点运算能力。1G=1024M、 1M=1024K , 这里的TFLOPS就是每秒运算能力为1兆=10的9次方,1TFLOPS等于1万亿次浮点指令。
和蓝色基因、RoadRunner这样拗口的超级计算机名字相比,地球模拟器不仅易懂,还富有强烈的科幻色彩。一部超级计算机,真的能模拟地球的一切运作吗?事实上地球模拟器所能做的,只是帮助人们模拟全球变暖问题,并且预测地球总体气候变化趋势而已,距离模拟整个地球的各个子环境运行仍然有着遥不可及的距离。但即便如此,把地球模拟器在1秒钟内完成的计算任务,交给一个人使用计算器来完成,却需要花上3000万年。毫无疑问,模拟天气变化仍然是当今庞大惊人的计算之一,我们每天看的天气预报背后实际上就是无数超级计算机连续运转的结果。
可是虽然当今最快的超级计算机IBM Roadrunner运算能力也已经达到1.026P Flops(千万亿次),但在Top500超级计算机排行榜中,仍然有大量超级计算机的运算能力,被天气变化和环境预测程序所消耗殆尽。可以预见,气候与环境的预测分析仍然是超级计算机们大显身手的领域。究竟气象与环境预测为什么需要如此惊人的计算能力?我们在多久的未来才能获得完全准确的天气预报甚至是地震警报?接下来请随我们一探究竟。
Part 2:气象模拟与预测:精确度与计算能力的较量
1.计算机在天气预报中起到的作用
天气预报自诞生以来就成了我们生活中不可或缺的重要元素。我们每天都会根据天气预报确定着装、是否带雨具等生活问题。如你所知,当今的天气预报仍然无法做到十分准确,无论是降雨还是气温都难以预报到百发百中。然而如今的天气预报,其实已经包含了无数科技上的巨大进步。
在过去我们只能使用天气图配合过去天气记录来进行预报。整个天气预报以天气图为主,配合卫星云图、雷达图等,用天气学的原理来分析和研究天气的变化规律,并通过概率统计总结出天气变化的统计规律来进行预报。而随着计算机科学的快速发展,当今的天气预报,除了运用上述手段外还引入了数值预报方法,即利用大型、快速的电子计算机求解描述大气运动的动力学方程组来制作天气预报。在这三种方法融合的情况下,天气预报的准确率已经大大提升。对于计算机来说,天气预报实际上是海量的方程求解,由于整个计算涉及大量方程组和变量,只要有细微的参数发生变化,整个结果就会完全不同。和其它科学计算相比,天气预测计算还有极强的时效性——面对瞬息万变的气候,也许大量参数在运行过程中就需要进行修正,天气预报更是在4~12小时内就会重新发布一次,这就意味着计算机必须在时限之内完成计算任务。
如果我们将获得的所有天气参数都交由计算机运算,那即便是Roadrunner也需要几天时间。为了解决时效性与精细度、精确度之间的矛盾,人们又构建了许多天气预报模型。当今我国使用的天气预报计算模型主要有国家气象中心中期数值预报业务谱模型(T106L19)、有限区域模式(HLAFS)、MM5模型以及WRF(Weather Research and Forecasting)模型等。其中T106L19和HLAFS模型一般只能用作中期(48~96小时)天气预报,而MM5模型则由美国宾夕法尼亚州立大学和美国气象研究所联合开发,适用于更精细尺度的短期天气预报。作为新一代的天气预测计算模型, WRF有着更准确的结果和区域性,但其计算量同样基于所有类型之首。在当今计算能力的限制下,我们一般只采用中尺度计算“颗粒”*(20~200km),而对于MM5和WRF来说精细度其实完全可以做到1km。
*注释:中尺度计算“颗粒”就是距离在20~200km之间的天气预报模型。颗粒是计算尺度/精度,20~200km之间为一个颗粒。
2.计算机可视化对气象预报的分析
那天气预报是如何在电脑上进行的?至此我们需要粗略了解一下什么是可视化计算。你可千万别以为我们当今玩的3D游戏、进行一些3D模型渲染就被称作可视化计算。事实上科学计算可视化(Visualization inScientific Computing)是发达国家在80年代后期提出并发展起来的一个新的研究领域。所谓可视化计算,是将科学计算过程中产生的数据及计算结果转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。随着技术的发展,科学计算可视化的含义已经大大扩展,它不仅包括科学计算数据的可视化,而且包括工程计算数据的可视化:如有限元分析的结果等;同时也包括测量数据的可视化:如用于医疗领域的计算机断层扫描(CT)数据及核磁共振(MRI)数据的可视化等等。
气象预报的准确性依赖于对大量数据的计算和对计算结果的分析。一方面,科学计算可视化可将大量的数据转换为图像,在屏幕上显示出某一时刻的等压面、等温面、位涡、云层的位置及运动、暴雨区的位置及其强度、风力的大小及方向等,使预报人员能对未来的天气作出准确的分析和预测。
另一方面,根据全球的气象监测数据和计算结果,可将不同时期全球的气温分布、气压分布、雨量分布及风力风向等以图像形式表示出来,从而对全球的气象情况及其变化趋势进行研究和预测。在当今气象预测机构中,许多都采用了将MM5、WRF模型导入可视化计算软件中进行计算的方法来预报天气。其中最为常见的可视化计算软件就是AVS/Express*。同样以地球模拟器为例,这部超级电脑在100km尺度的情况下需要3小时才能计算出目标地区的天气变化,如果将尺度缩小为10km,那计算时间更需要以天来计算。
*注释:AVS/Express是一个通用的,非常容易使用的数据可视化工具,不仅适用于有经验的开发者,而且适用于非程序开发者。对于任何需要数据可视化的任务, AVS/Express是最好的选择,它提供非常直观的图形应用开发环境,以及快速的数据分析和丰富的视觉技术。AVS/Express可以广泛应用在很多领域,包括科学,商业,工程,医疗,通信和环境研究等。
3.我国用于气象预测的计算机技术的发展
如今世界性的气候变化日益复杂,为我国气象预测和天气预报的准确度带来了新的挑战。从2007年开始,我国省市级的气象部门都逐步转向MM5和WRF气象预测模型的研究,相应的计算机也进行了全面的升级。北京市气象局就在2007年购买了IBM System P575超级计算机。新计算机的计算能力是北京市气象局之前系统的10倍。这台超级计算机除了按小时提供天气预报外,还将被用于预报北京的空气质量。北京市气象局将利用这台计算机提高北京周边地区天气预报的准确性。IBM的System P575采用了 Power5 处理器*,可以在单个节点提供8~16内核、1.9~2.2GHz的超高运算密度。
*注释:新的Power5 处理器被称为“片上服务器”, 是基于Power5处理器的增强版,包括2个处理器,一个高带宽系统交换器,一个更大的高速缓存和I/O界面。可使System P575为用户提供更强大的性能,而功耗更小。
除了北京气象局以外,各省市级的气象局所使用的计算机大多为x86集群。其中曙光天朝4000系列集群有着较高的占有率。该集群采用的该款计算机使用了2560个AMD公司的Opteron*处理器,拥有最大11 TFlops的浮点预算能力和最大42TB的存储容量。曙光4000A可以在1小时内,同时完成4次36小时的中国周边、北方大部、北京周边甚至到北京市的2008年奥运会所需要的气象预报计算,计算项目包括风向、风速、温度、湿度等,精度达到1km,即精确到每个奥运会场馆。
*注释:AMD Opteron(皓龙) 处理器是专为服务器与工作站而设计的集合32 位与 64 位计算优势的处理器方案。
Part 3:地震监测与分析:海量数据与带宽的博弈
1.地震监测的重要性
今年5月12日的四川大地震让我们充分认识到了大自然的破坏力,在灾难过后许多人都在思考地震是否能预报,或是如何将地震带来的损失减少到最低。虽然地震能否被预报到现在仍然是个极具争议性的话题,然而降低地震所带来的损失却有着大量切实可行的方法。而在这些方法背后,超级计算机强大的运算能力同样功不可没。
和气象预测有着明确的模型和分析,只需要进行复杂计算不同。降低地震的损失主要通过在地震后迅速发出通告为主要手段。由于地震波的传播需要时间,只要地震通报能快于地震波传递的速度,就有降低伤亡损失的可能性。如今我国整个国土上建造了大量用于测量地震的地震台,并将它们相互连接构成地震台网。每秒钟地震台都将会向数据中心返回海量的报告,要在尽可能快的时间内完成对返回数据的分析和挖掘,才有可能降低地震的伤亡。
2.我国用于地震研究的计算机技术发展
根据国家地震局工程力学研究所披露,用于进行科研的地震工程远程协同实验系统(Network of Earthquake Engineering Simulation)所使用的计算机采用了高密度刀片架构,拥有256个计算节点,浮点双精度运算理论运算峰值能力可达到 20 TFlops。在2007年,大庆油田公司勘探开发研究院的地震资料处理系统采用了692台HP BL20PG3、HP DL380G3和HP DL580G3服务器,拥有1432个Intel Xeon CPU,峰值浮点运算能力达到9.8 TFlops。成功跻身Top 500超级计算机排行榜。,
由于地震的能量会逐步从地壳释放至地面,所以我们的地震预警系统就可以探测到地壳内部最细微的地震波,然后根据设定发出警报。在绝大部分情况下,这些预警系统能提前15~30秒提供地震预警——这区区几十秒很多时候就是生与死的差别。因此在未来我们减少地震损害的最有效的方法,仍然是如何快速汇拢全国各地的地震台、感应器之间发回的数据,然后及早提供预警信号。这对于当前还相对有限的计算能力和数据传输带宽来说,仍然是个很大的挑战。
Part 4:地球计算,平民参与
虽然我们当今台式机上用的Core 2 Duo处理器,只有不到30GFlops的浮点运算能力,对于动辄以Tera计算的应用来说只不过是杯水车薪。可是如果能把地球上数以亿计的桌面电脑、笔记本电脑的运算能力“汇集”起来,就能获得惊人的浮点运算速度。
为了实现这个目标,全民参与的分布式计算活动被全面推广开来。首个分布式计算程序SETI@Home(在家寻找地球外智能生物)推出至今,已经借助平民的力量完成了几十PB*射电望远镜资料的分析和挖掘。而随后兴起的Folding@Home(蛋白质折叠分析)在SONY PS3、NVIDIA、AMD显卡以及大量台式机的助力下,已经拥有超过1 PFlops的处理能力。对于普通用户来说,只需要安装对应的客户端程序,在机器空闲时程序就会代替Windows屏幕保护贡献出自己的处理能力。
*注释:PB是PetaByte的缩写,是2的50次方,相当于1024TB。
结语
相信随着未来运算能力的几何级数提升,普通用户更多地参与到分布式计算当中,我们对天气与地震预测的准确性也将更高,那时我们更能感受到计算机带给我们的美好生活。