论文部分内容阅读
高速发展的网络和不断提高的微处理芯片性能使得计算机网络成为吸引人的并行计算载体。仅依赖于商业化的硬件和软件,计算机网络能够提供高性价比、高可用性的计算,这种高性能计算潮流被称为集群计算。
当今,集群计算已经成为一种解决许多大型科学和工程问题的十分有效的方式。影响集群计算性能的因素有很多,诸如任务粒度、负载平衡、处理机的分配和网络拓扑等,其中负载均衡和任务调度策略是影响其性能的关键,已发展成为并行计算领域中的研究热点。
基于集群环境上的并行计算,由于其环境的异构性,为了更高效的充分利用各类计算资源,就要求程序设计人员依据各计算结点的不同特性分配其上不同类别的子任务,以达最佳效率。其中,负载均衡是影响计算性能的重要因素之一。
本文首先研究负载均衡调度策略及调度问题的一般模型,总结了影响调度性能的各种因素。针对这些不同的因素,本文提出了一些新的策略,改进了某些现有的方法:如为了解决集中式的任务调度策略中调度结点容易成为瓶颈的问题,本文提出两层调度的思想,使系统具有良好的扩放性和负载均衡性能;通过将主动报告与自适应周期汇报相结合来解决负载收集问题,尽量保证负载信息的有效性又合理的避免了过多通信带来的开销。最后,综合以上内容,在MPICH环境上给出一个完整的两层调度算法,以一个实例进行测试,证明其有效性。