论文部分内容阅读
随着集合通信的通信开销在大规模高性能应用中所占比重越来越大,对集合通信的优化工作也越来越得到人们的重视。其中MPICH2的底层通信库在实现集合通信中的广播操作时都要最终转化为多次点到点通信操作。重复的多次点到点通信无疑会引入额外的软件开销,最终影响广播的通信效率。同样的,利用多次单播实现UDP广播的做法与MPICH2广播实现类似,多次单播操作必然导致多次重复的系统调用和数据拷贝,因而本文提出一种机制,将原本在软件层实现的广播报文生成功能转移到硬件层面实现,以此来减少系统调用和数据拷贝的次数,达到优化广播通信效率的目的。