An Evaluation of Unified Memory on NVIDIA Kepler K40 and Jetson TK1

来源 :2014全国高性能计算学术年会 | 被引量 : 0次 | 上传用户：ibyxpr

【摘要】

：

　　The Unified Memory in CUDA 6.0 is one of the most significant update in the history of CUDA.Before CUDA 6.0,existing programming model for GPU computing rel

【作者】

：

XuewenCui[1]WenqiangLi[1]SimonSee[2]JamesLin[3]

【机构】

：

Center for High Performance Computing, Shanghai Jiao Tong University

【出处】

：

2014全国高性能计算学术年会

【发表日期】

：

2014年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　The Unified Memory in CUDA 6.0 is one of the most significant update in the history of CUDA.Before CUDA 6.0,existing programming model for GPU computing relies on programmers to explicitly manage data transfers between CPU and GPU and manage memory coherence.While Unified Memory provides a new CUDA programming model that defines a new managed memory space in which CPU and GPU see a single coherent memory image with a common address space.The underlying system manages data access and locality without the need for explicit memory copy calls.This paper is about the influence on application performance caused by Unified Memory and analyzing the underlying implementation.We studied Diffusion 3D Benchmark,Parboil Benchmark Suite,and the Matrix Multiplication from CUDA SDK Samples as supplement and ported these benchmarks to Unified Memory version.The evaluation is based on NVIDIA Kepler K40 and Jetson TK1 by comparing the performance between Unified Memory version and original version.K40 is the latest and fastest GPU with Kepler architecture,and TK1 is the first mobile processor built on the same Kepler architecture which shares a 2 GB main memory with CPU and GPU.This paper shows that Unified Memory causes at most 10% performance loss both on K40 and TK1.Furthermore,we use NVIDIA Visual Profiler to dig into the underlying mechanism of the Unified Memory.Finally,we state the reason for performance loss.

其他文献

图的邻点可区别正常边染色算法

　　An adjacent vertex distinguishing proper edge coloring of a graph G is a proper edge coloring such that no two adjacent vertices assign the same set of colo

会议

基于神经网络的用户视频评分自动获取方法

在未来的智能电视系统中,真正的智能视频推荐应该是不需要用户评分动作就能自动、准确地获得用户兴趣、爱好并做出推荐的系统.研究无评分动作约束下的用户评分(揭示了他们的

会议

神经网络智能视频隐性评分自动智能推荐用户兴趣电视系统实验结果

小学数学生活化课堂构建策略浅析

摘要：数学知识来源于生活又服务于生活。新课改背景下，要求小学数学老师的教学要立足于真实的生活，在生活中加深学生对于知识的理解，强化小学数学课堂教学的效果。因此，本文对小学数学生活化课堂构建的策略进行介绍。　　关键词：小学数学;生活化;构建策略　　新课改背景下的小学数学教学中，只有结合学生的生活实际来教学设计，才能够实现对学生学习兴趣、实践应用能力的培养，从而让学生从小喜欢上数学学科，助力学生的有效

期刊

小学数学生活化构建策略

读蒙文通先生遗著《周秦民族史》

先君蒙文通遗着《周秦民族史》着笔于1927年,至1931年尚未完稿,即以所得教授于河南大学;1933年再以教授于北京大学;1935年又以教授于河北女子师范学院,始成完篇。以友人顾颉

期刊

周秦民族史文通赤狄白狄犬戎鮮虞潞氏戎狄沿革地理齊桓公

语文课堂中如何培养学生的问题意识

摘要：“每事问”这句话，是孔子对自己学生的要求。这句话高度评价了问题意识的价值和意义。宋代理学大师朱熹也说：“疑是恩之始，学之端。”“读书无疑者，须教有疑，有疑者却要无疑，到这里方是长进。”这是宋代的另一位大学者陆九渊的观点。近代著名的教育家陶行知说得更形象，他在艺术诗里写道：“发明千千万，起点是一问。禽兽不如人，过在不会问。智者问得巧，愚者问得笨。人力胜天功，只在每事问。”这一切都在阐释着培养学

期刊

语文课堂问题意识培养

对提高岩溶地区岩土工程勘察质量的探讨

提高岩溶地区岩土工程勘察质量可以为工程建设项目提供准确的地质状况报告,保证工程建设项目顺利开展实施.本文主要研究提高岩溶地区岩土工程勘察质量的措施,希望可以为相关

期刊

岩溶地区岩土工程勘察质量措施

体坛趣闻

７月２５日至８月８日,泛美运动会在加拿大中部城市温尼伯进行;在扣人心弦的田径比赛中发生了一件轻松有趣的事情。墨西哥竞走选手贝纳多·塞古拉夺取男子２０公里竞走金牌之后,立刻脱下一

期刊

世界纪录泛美运动会世界田径锦标赛塞维利亚田径比赛纪录保持者塞古温尼伯比赛过程中部城市

课程思政融入大学健美操课教学设计的探究

现阶段大学教育重视对大学生综合能力的培养,培养符合当前社会需求的高素质综合型人才.在健美操课程教学活动中,教师重视对学生的引导,使用正确的教学方法,改善当前教学活动

期刊

课程思政大学健美操教学目标评价体系

R-Grams文本相似度计算中的随机策略研究

R-Grams文本相似度算法是一种可应用于长文本相似度计算的新型算法,通过随机策略,充分利用了短n-Grams的细粒度检测特性和长n-Grams的高效检测特性,具有语言无关、精度和速度

会议

长文本相似度计算随机策略相似度算法n-Grams位置约束检测特性实验结果

关于制订车间空气中有害物质最高容许浓度的几个基本问题

苏联早于1930年就公布了十二种化学物质的最高容许浓度,随后美国马萨诸塞州(1937年)发表了容许浓度表,1938年德国发表了二十五种溶剂的最高容许浓度表。直到目前为止,已有二

期刊

最高容许浓度车间空气化学物质安全系数毒物动力学毒作用带美国马萨诸塞州工业毒理学毒理学研究毒性

An Evaluation of Unified Memory on NVIDIA Kepler K40 and Jetson TK1

其他学术论文