SIMD结构中多指令流扩展的设计与实现

来源 :第十九届计算机工程与工艺年会暨第五届微处理器技术论坛 | 被引量 : 0次 | 上传用户:zhaijiayue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  包含多分支循环的应用程序在由统一指令流控制的传统SIMD结构上映射时存在效率低,以及数据并行性不能充分开发的问题.为此,本文提出一种基于指令混洗机制的多指令流扩展方法.该方法可为SIMD结构各通道派发不同分支路径的指令流,实现处于不同分支路径的通道并行执行的效果.与传统基于掩码屏蔽的处理方式相比,该方法极大提高了多分支结构的处理效率.我们对多指令流扩展机制进行了基于Verilog的编码实现,并在自主SIMD处理器FT-X DSP中进行了验证.实验结果表明,相比传统SIMD结构,本文所提方法能够以0.7%的面积开销,获得1.1~6.0倍的性能提升.
其他文献
  FIR滤波器是数字信号处理中最基本的元件,它可以在保证任意幅频特性的同时具有严格的线性相频特性.FIR滤波器原理是输入序列与系数序列做卷积运算,主要结构就是一串移位
会议
钢筋混凝土(RC)框架结构以其平面布置灵活,良好的受力性能和经济效益高等优点,在全世界得到了广泛应用。随着时间的推移,RC框架结构的耐久性问题也更加突出。钢筋锈蚀作为影响既有
  前导零预测器(LZA)是浮点加法器和浮点融合乘加部件中一个主要的组件.它一般位于关键路径上,与加法器并行进行能有效减小关键路径上的延时.一般的LZA可以分为两类:精确的LZ
  随着工艺特征尺寸的不断缩小,芯片的可靠性问题日益突出。本文针对芯片的片上存储结构,提出了一种基于路交叉的低开销高可靠片上存储体容软错误设计方法。该方法将片上存储
大量震害调查分析表明,梁和柱的连接处是许多震损钢筋混凝土框架的薄弱部分。随着钢筋混凝土梁-柱节点的试验和理论研究的深入,人们也逐渐认识到节点核心区的严重损伤会引起梁
  随着云计算、物联网、社交网络等技术的发展,数据正以前所未有的速度在不断地增长,大数据(Big Data)时代已经到来。然而,传统处理器的计算密集型结构设计难以满足数据密集型
会议
在可重构处理单元阵列、片上总线和片上网络中,广泛使用开关网络来实现信息交换。随着VLSI工艺水平和集成度的不断提高,片上开关网络功耗已成为影响芯片系统功耗不可忽视的重要
会议
在土动力学研究中,随机振动已成为该领域的研究热点之一,是开展岩土工程以及地震工程等领域研究工作的基础性课题。影响地震动响应及其反应谱的三大主要因素分别为:震源特性
  本设计实现了一款多核DSP芯片中核内部高效通信的总线.该总线支持对读返回数据重排序,从而保证顺序的输出从设备返回的信息.同时结合对DSP内核通信特点的分析,优化了写数据
目的:制备白藜芦醇纳米乳,并进行质量评价;探讨其对体外培养的人肝癌细胞株HepG2的诱导凋亡作用和对大鼠肝细胞的毒性。方法:(1)选用非离子型表面活性剂蓖麻油聚氧乙烯醚(EL-40)、聚氧乙烯醚(40)氢化蓖麻油(RH-40)、Tween80、Span80,采用三元相图法筛选处方并考察影响纳米乳形成的影响因素,对各处方的理化特性、稳定性进行考察。(2)以肉豆蔻酸异丙酯(IPM)为油相、无水乙醇为助