多层周期结构光栅衍射模拟算法的GPU加速研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:cloudyliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半导体芯片的集成度越来越高,微细加工早已进入纳米级,其结构上如果存在微小的瑕疵也会引起性能的极大改变。用光学的方法测量器件的关键尺寸应用广泛,而分析这些结构的模拟算法通常都是计算量巨大,计算过程相当耗时的。GPU从单纯的图形处理发展到应用于通用计算领域,其巨大的并行计算能力在许多领域取得了良好的效果。本文的研究目的是利用GPU的并行计算能力加速模拟算法的计算过程。这些算法多数都是从麦克斯韦方程组出发,采用不同的方法最终推导出结论。在算法推导过程中,大量的方程以方程组的形式存在,因此导致在模拟计算过程中,涉及到大量的矩阵运算,如矩阵乘法、LU分解、求逆和求特征值等,计算量大,计算过程费时。为缩短计算时间,加速计算过程,本文从软硬件两方面入手。硬件方面利用GPU的并行计算能力做并行计算,软件方面采用CUDA技术实现在GPU上的并行计算。本文首先从麦克斯韦方程组出发,介绍了RCWA算法和SAM算法两种算法。然后介绍了GPU应用于通用计算的发展情况,对CUDA模型和加速原理做了介绍。接着对几种常见的矩阵运算也做了简要介绍,并且完成了几种矩阵运算的CUDAC代码,测试了各函数计算不同规模矩阵的效率,将GPU的计算时间与CPU的计算时间做了对比,分析了GPU在本文中做加速计算的优势和不足。最后,根据算法的特点,选取了较优的方案,将自有的函数和其他一些矩阵运算库编译成一个新的库,完成了GPU和CPU两种接口的代码,应用于RCWA算法和SAM算法中,并分别测试了GPU对两种算法在一维情况下和二维情况下的加速效果。结果显示,与CPU相比,GPU对RCWA算法的二维情况有一定的加速效果,对SAM算法的二维有良好的加速效果。最后,优化了SAM方法,提升了加速效果。
其他文献
石墨烯是sp2杂化碳原子排列成蜂窝状六角形晶格结构的二维介观体系,这一概念最早被Boehm于1994提出。自从近年来稳定的单层石墨在实验上被发现以来,人们就对石墨烯这种材料开
聚合物体异质结太阳能电池概念的提出极大的加快了有机太阳能电池的发展,传统的热退火处理能使聚合物晶化,增强空穴和电子的传输平衡,提高器件的效率,但其中杂乱的给受体相分
稀土元素具有丰富的能级和亚稳态,由于其结构的特殊性,能级跃迁通道多达20余万个,可以产生多种吸收和辐射。稀土离子发光具有很多优异性能,可广泛应用于发光和激光材料,使得
黑洞热力学第一定律描述了黑洞演化时,表征黑洞性质的物理量(质量,面积,电量和角动量)之间相应的变化关系,它已经通过许多方式被证明。其中基于Killing视界的物理过程第一定
随着我国工业化的迅速发展,大气环境污染问题日益严峻,严重威胁着人们的身体健康,发展大气污染物的检测技术,对环境污染的监控以及环境科学的研究具有重要的意义。本论文针对
学位
单层石墨(Graphene)作为一种新型的材料,由于载流子的线性色散关系,与常规的自由电子二次色散关系有着重大的区别,对实验及理论都有着重要的意义,虽通过相关理论及实验证明,G
心磁图(MCG)在心脏疾病的临床诊断上具有很大的优势。相较于心电图(ECG),心磁图具有非常高的分辨率,可以获得心脏磁场的空间分布,测量心脏电流的直流分量。而在心脏疾病方面
量子色动力学作为粒子物理标准模型的重要组成部分,尽管早已经为学术界所公认,但其在非微扰区域的理论计算依然是一个充满挑战性的研究领域。我们知道,强相互作用体系的两个最重
学位
Tokamak等离子体中存在各种热源,可是热源(特别是非局域热源)的存在对撕裂模的影响目前还没有被人们充分注意。本文通过计算二维磁岛能量输运方程发现热源剖面分布与磁岛内温
学位
人工超材料由于具有自然材料所不具备的特殊传播特性,从超材料提出来以后,其诱人的应用前景引起了人们的广泛关注,人工超材料可以构造出高阻抗介质,可以得到负的介电常数和负的磁导率,这种可控的特性一下子成为最近几年来学术界关注的热点之一,随着人们对超材料认识不断的深入,超材料的应用范围将不断扩展和深化。多层金属——介电质堆结构(Multilayered metal dielectric)是人工超材料研究中