SMP集群上细粒度时间同步并行模拟程序的优化

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:langguoji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模拟是计算机体系结构研究的重要手段,也是很多其它科学与工程学科日益采用的研究方法。模拟并行化则是主要的加速方法。计算机系统的并行模拟,通常具有细粒度任务并行的特性,以及不规则的微秒级的通信间隔。由于所研究的目标系统规模持续增大,串行模拟器甚至共享内存系统上的并行模拟器都难以满足需求。因此开发分布式系统上的细粒度并行模拟器,并对其进行优化以提高并行效率,对众多有此类需求的应用而言是亟待解决的问题。进一步地,这方面的研究结果可以推广到其它大规模细粒度任务并行程序,也是对并行计算领域编程模型的一个有意义的探索。   离散事件模拟是计算机系统模拟经常采用的方法,其核心技术是同步机制的实现。由于状态集大的缘故,计算机系统模拟一般都采用保守同步算法。这种算法的性能受限于通信系统,在SMP集群上并行很难得到加速。本文分析了保守算法中各种消息的特点,通过将同步与事件分离、双边通信转化为单边通信,有效地简化了同步操作,为低延迟同步提供了可能性。以此为基础,结合一些通信硬件的RDMA特性,本文提出并实现了基于RDMA的快速同步算法:CMB-RDMA算法。实验表明,此算法带来了很大的性能提升。   MPI+Pthreads是SMP集群上任务并行所普遍采用的计算模式。考虑到线程安全支持带来的可移植性问题和性能开销,利用代理模块来完成所有线程的统一的对外通信已成为一种直观的、扩展性良好的实现方式。但是这种做法有不可避免的缓冲带来的延迟,在实现和优化上需要小心处理才有可能获得较好的性能。本文针对通信代理延迟与模拟引擎调度算法紧密结合的特性,对通信代理进行高优先级调度,提高了模拟引擎通信系统的性能,并进一步地提高了整个模拟程序的并行效率。   本文以SMP集群上的计算机系统模拟平台作为算法实现和性能评测的载体。模拟的目标系统具有上千个模型组件,同步粒度在几十微秒量级。实验表明,采用上述优化策略后,即使模拟引擎的消息传递系统以延迟较大的以太网为介质,也可以获得稳定的加速。16进程的并行加速比稳定在7x以上,最好情况下可以得到线性的加速比。
其他文献
云计算的出现与发展使得传统的计算单元由物理机变成了虚拟机,应用程序运行于虚拟机之上,虚拟机则寄宿在物理机上,虚拟机的部署对云环境的资源使用率、负载均衡、虚拟机的性
近几年来,随着地理信息系统(GIS)不断应用和推广,空间数据库的研究取得了非常大的发展。空间查询作为空间数据库最核心的功能之一,其性能成为决定空间数据库性能的关键因素。但
信息技术不断发展和变化,对人类生产方式、生活方式以及学习方式产生了巨大影响和深远意义,人类正在经历信息文明。信息技术已经渗透和融入到各行各业,在教育领域,信息技术正在推
随着集群系统应用范围的扩大以及规模的增加,其管理复杂度和成本也随之大幅度地提高,而资源利用率却没有得到显著提升。为了有效的解决这些问题,近几年来,学术界和工业界出现了很
随着计算机技术和Internet技术的迅速发展,企业的信息化管理需求越来越高,许多企业、学校等机构纷纷建立了自己各部门的信息系统。然而随着信息化建设的加快,在实际应用中我们经
InfiniBand(IB)是一种高带宽低延迟的工业标准高性能互连网络,具有支持RDMA等高级特性,是目前高性能集群计算系统内部互连的主流技术之一,为提高Java应用集群系统的通信性能提供
代码自动生成工具是工业产品V字型开发流程的重要组成部分,它连接数学建模和原型开发两个环节,在加快产品开发进度的同时,大大降低手工编码所引入的错误,让开发人员有更多时间和
星载计算机运行时易受空间辐射效应的影响,系统硬件平台需要提供一定的可靠性保障,而系统软件是星载计算机的核心,它配合系统硬件工作并且提供更为灵活有效的可靠性设计。另外,日
SIP(会话发起协议)是由IETF提出的用于发起、修改和终止多媒体会话的应用层控制协议,已经广泛应用于VoIP系统中。基于SIP协议的VoIP系统由于其客户端/服务器的服务架构,在用户
随着以Ajax为重要特征的Web2.0技术体系的迅速发展,许多网站从传统的Web应用向富互联网应用(RIA)转型,并从中获得了丰厚的收益。这又反过来促进了Web2.0的发展,形成了Web开发的