【摘 要】
:
本文提出新的辅助预取线程生成策略,有效地挖掘这类数据结构本身蕴含的访存并行性。进一步,探讨了在片上多核处理器上实现上述辅助预取线程机制所需的软硬件基础设施。实验数据表明,该机制能够有效地缓解处理器的访存瓶颈,进而达到在片上多核处理器上加速"树类应用"的目的。
【机 构】
:
中国科学院计算技术研究所计算机系统结构重点实验室,北京,100080
【出 处】
:
2006中国计算机学会体系结构专委会学术年会
论文部分内容阅读
本文提出新的辅助预取线程生成策略,有效地挖掘这类数据结构本身蕴含的访存并行性。进一步,探讨了在片上多核处理器上实现上述辅助预取线程机制所需的软硬件基础设施。实验数据表明,该机制能够有效地缓解处理器的访存瓶颈,进而达到在片上多核处理器上加速"树类应用"的目的。
其他文献
本文根据开放式环境的特点,首先构造了一个四层开放式协同设计环境,接着提出了一种适合于此环境的事务提交协议(O1PC),并分析了该提交协议处理故障的情况。该协议具有较好的消息复杂度和日志复杂度,并解决 了一阶段事务提交协议中的站点自治问题。
本文分析了桌面文本搜索应用的指令级特征,发现该应用具有内存带宽利用率低、CPI值相对比较高、分支预测失效率高的特点,并设计了基于倒排索引技术和向量空间模型的并行桌面搜索系统,取得了较好的加速比。研究结果表明,桌面文本搜索应用可以通过多线程并行化在未来的多内核处理器上有效地执行。
本文首先介绍了UWB在无线个域网中的应用,分析了WPAN标准协议IEEE802.15.3,并指出将其应用于高速无线个域网实时数据传输时存在的不足;接着分析了GRATS协议以及IEEE802.11协议;基于GRATS和IEEE802.11,提出了一种新的高速无线个域网MAC方案,并给出了相应的算法;最后,通过对该算法进行模拟分析,表明此算法在保证UWB的无线个域网实时数据有效传输的前提下,利用了带宽
本文在介绍CTMAC协议的基础上,对该协议的并发规则进行了证明,并从理论上讨论了CTMAC协议的开销。通过模拟并与IEEE 802.11和MACA-P比较表明,CTMAC协议可以有效的提高网络吞吐量。
本文分析存储系统延迟的主要原因,提出退化链数据猜测方法,该方法利用数据猜测打破循环的有环相关图中某些限制,拓宽内存访问操作的指令调度空间。实验证明,该方法可以开发软件流水对存储系统的优化潜力。
本文在分析了待调度任务对本地资源和远程节点资源的影响后,提出了一种基于竞争分析的面向多资源的负载平衡算法(MRLB)。该算法借鉴了经济学上的边际成本思想,负载平衡的目标也不局限于CPU资源,而是扩大到所有的系统资源上。算法能在系统全局信息不完整或者信息存在较大延迟的情况下正常工作,有效地消除了负载信息不准确以及负载集中对算法稳定性的不利影响。模拟实验表明,本算法减少了任务的平均减速,并能在保证系统
本文介绍了OGSI规范,指出了OGSI和Web服务不能很好融合的缺点.WSRF利用了新的Web服务标准,重构和发展了OGSI,实现了网格和Web服务的融合。分析了WSRF和WS-Notification主要规范,并讨论了WS-RF和OGSI的关系,最后对未来的发展趋势进行了展望。
本文分析了二维网孔(MC2)结构中的矩阵转置并行算法的原理,并针对其处理节点多、节点间通信的频率高、通信数据量大而导致计算效率低、成本高的缺点,提出了直角划分矩阵转置并行算法。该算法将矩阵中互换位置的两个元素划分在同一个子块中,由同一个处理机进行转置计算,有效地避免了处理机之间的通信,提高了计算效率.通过对测试结果进行分析,证明该算法合理划分矩阵,减小了处理节点间通信开销,从而大大提高了并行计算的
本文针对大规模广域网络应用环境,创新性地提出数字有机体互斥机制(DosM).它通过为不同的资源指定不同的资源锁控制节点集,将分布式资源锁管理转换为多个单机锁管理,并采用类Pastry的LPastry机制实现资源锁控制者确定,从而保证DosM机制能够克服大规模广域网络应用环境的三个难题,并具有较高的性能和可靠性。
本文采用一种群集智能方法--PSO算法,进行工程项目的资源均衡研究,并根据目标函数的具体要求,有效地求得多资源平衡问题的最优解。编制了相应的程序并进行了仿真,得到了较优的结果,从而验证了算法的有效性和可靠性,对于工程项目管理中资源优化具有一定的实际应用价值。