【摘 要】
:
The development of multi-core processors proves to be two trends: one is general purpose multi-core processor with low growth of core numbers,the other is many-core processors in data-intensive domain
【机 构】
:
中国人民大学 信息学院,北京 100872;中国人民大学 知识工程与信息工程教育部重点实验室,北京 100872
论文部分内容阅读
The development of multi-core processors proves to be two trends: one is general purpose multi-core processor with low growth of core numbers,the other is many-core processors in data-intensive domain with rapid growth of core numbers.Nowadays and future on-line analytical processing shows the characteristics of big volume and high velocity,complex data management and data processing capacity are essential,the database management needs both the powerful data throughput and real-time analytical processing capacity with equal importance.This paper proposes co-OLAP technique on hybrid CPU and GPU platform with GPU oriented bitmap join index and GPU index processing.Distribution and query processing optimizations are implemented between CPU memory and GPU memory for the important multidimensional storage and index techniques,and with these approaches,different processors’ hardware advantages are fulfilled for improving big data latency between GPU memory and CPU memory.The overall performance for complex multidimensional analytical processing is improved for the hybrid CPU and GPU platform.
其他文献
OpenACC is a programming standard designed to simplify heterogeneous parallel programming by using direc- rives Since OpenACC can generate OpenCL and CUDA code lneanwhile running OpenCL on Intel Knigh
针对基于二阶多节点多面体网格的表面重建过程中存在的准确拓扑及绘制、传输代价等问题.提出了一种基于关键特征控制的表面重建技术。本文研究并分析了二阶多节点多面体单元等参插值函数的性质特征,在网格单元棱边插值计算曲面轮廓点,在网格表面及体内提取曲面的几何特征关键点,根据三关插值关键点间的逻辑关系制定了令拓扑准确唯一的面片三角化规则及修复策略,设计了基于关键点的三角面片压缩索引结构。实验结果证明,该方法可
基因组数据的快速增长,为群体遗传学研究积累大量第一手的宝贵信息,同时也对如何快速处理这些信息提出巨大的挑战.本文研究了一种新型群体变异检测方法中的动态规划迭代算法,首先将其转化为一系列的矩阵乘法,利用结合律发掘了并行性,接着设计了面向GPU架构的高效实现,与原先的CPU版本相比速度提升超过两百倍;在此基础上,通过MPI实现数据并行计算,利用天河一号超级计算机的多个GPU计算节点获得了进一步加速.本
本文重点介绍对应用与图形绘制的力导引算法的加速.首先使用OpenMP进行多线程并行化,得到一个并行的版本,可以从多核或众核平台中受益.然后,通过编译器自动使用SIMD(单指令多数据)指令,并进一步手动优化向量化.对程序在OpenMP线程和问题规模的不同组合条件下分别在CPU和IntelXeonphi(或者称为MIC)上进行数值实验.数值试验表明:经过优化后的算法比原始算法具有更高的性能.最后,总结
高效并行的Kotm-Sham方程求解器是支撑大规模第一性原理材料模拟的核心,流行的第一性原理商用软件难以适应国产高性能计算机的发展。对此,本文基于JASMIN框架自主研制了Kotm-Sham方程并行求解器。求解器采用PAW赝势平面波方法,包含两项关键技术;倒空间多重网格方法、“k点/轨道/网格”三级并行算法。前者在保证精度的同时显著节省了计算与存储开销;后者充分挖掘了求解Kotm Sbum特征值方
文件分享是互联网的传统应用.P2P技术已表明可以用来提供大规模的网络服务,BT是互联网最为流行的P2P内容分享应用之一.但标准的BT协议以段为单位传输,在传输过程中,远程结点的离开,本地结点会重传与离开的远程结点未传输完成的段,这就导致了已传输的不完整的数据段失效,增加了传输开销.本文主要研究如何通过改进BT协议,使其不仅能支持文件分享,更能针对远程结点离开,对已传输的不完整的数据进行续传,进一步
基于光滑粒子流体力学(SPH:Smoothed Particle Hydrodynamics)的流体仿真是虚拟现实技术的重要研究内容,但SPH流体仿真需要大量的计算资源,采用一般计算方法难以实现流体仿真的实时性.流体仿真通常由物理计算、碰撞检测和渲染等部分组成,借助GPU并行加速粒子的物理属性计算和碰撞过程使SPH方法的实时流体仿真成为可能.为了满足流体仿真应用中的真实性和实时性需求,本文提出一种
运行于互联网的网络化软件系统,其组成元素相互依赖和交互,行为复杂,不仅增加了我们理解和改善系统的难度,而且系统中的一个小错误可能引起整个系统的瘫痪。因此,研究新的测试、监控及可信性保障方法以提高软件系统的可靠性是亟待解决的。本文中,我们研究了带部分标记和不带标记的网络化软件交互行为踪迹。首先,提出了状态转移结构图及行为踪迹模型。此外,创新性地将偶图匹配算法及网络流算法分别运用到重新标记不带标记和带
字符串模式匹配是计算机研究领域的一个经典问题,是众多网络安全系统中的关键技术。随着信息时代的硬件技术和网络技术的发展,大数据的处理和新的应用需求对字符串匹配技术提出了新的挑战。后缀数组是字符串匹配中高效的数据结构,它解决大量文本数据库中的复杂查询问题。本文主要针对于多核计算环境的系统架构特点,对后缀数组算法进行改进优化,增强算法的执行性能,提高算法的并行效率。最后与BF 算法和后缀数组串行算法进行
在并行计算实践中,并行任务的执行时间和并行计算系统的可扩展性同为并行计算重要的性能参数。然而以往关于可扩展性的研究未充分考虑并行执行时间因素,可扩展性与并行执行时间的关系仍未研究清楚。本文深入和全面研究可扩展性与并行执行时间的关系,特别是延迟可扩展性和执行时间的关系,得出并证明了不同算法-机器组合体在相同初始状态下进行延迟扩展后,其并行执行时间和延迟可扩展性关系的一些重要结论。最后,本文通过对不同