管线、单元、乱花不再迷人眼!

来源 :微型计算机 | 被引量 : 0次 | 上传用户:zzx2324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  新手朋友想买一款称心如意的显卡并不容易,要考虑品牌、价位、性能以及诸多方面的因素。正当很多人看得脑袋都晕的时候,部分厂商还玩起了数字游戏,类似“12管线”、“36像素处理单元”这样的宣传话到处飞。仿佛数字越大的东西性能也一定越好。究竟是不是这么一回事呢?下面就让我们一起去看看吧!
  稍微了解一点显卡知识的朋友们一定不会对“渲染管线”的这个词感到陌生。按照传统观念,一款图形显示芯片的渲染管线数量往往决定了这块芯片的性能和定位。了解了这些之后,新手朋友们就很容易理解和比较两块显卡的性能。然而最近有些厂商在宣传时使用了另外一个词——“像素处理单元”,这个又是什么“东东”呢?“管线”和“单元”到底谁决定了显卡的性能呢?
  
  一、管线的来历
  
  我们平常说的“管线”,其学名应该叫做“图形渲染管线”。它就好像是工厂的流水线,按照不同的生产指令(当然在计算机中指令应该是由CPU发出来的)来产生3D图形。通俗一点来讲,一条完整的图形渲染管线应该是可以独立完成图形渲染任务的所有处理单元的总合。所以管线的定义需要配合相应的API(应用软件接口程序)来进行,不同的API程序对管线的要求也不尽相同。以我们最常见的DirectX程序为例,一条管线包括三个部分。
  
  Vertex Shader(顶点渲染引擎):通常简称为VS,它的主要作用是生成3D图形的骨架——顶点。任何3D图形在计算机的世界里其实只有两种存在形式,构成骨架的顶点以及连接顶点之间的直线。举个例子来说,我们日常生活中的一个圆,但在计算机看来并不是圆的,如果我们要求的精度较低,它就会把这个圆当成6边形来处理(即六个顶点和连接相邻顶点的直线);如果我们的要求很高,则会使用到上百边形,比方说360边形,即360个顶点和360条直线。如果知道了这些,就很好理解VSI作的重要性了,VS就是构建顶点的场所。
  
  Pixel Shader(像素渲染引擎):通常又称为PS,它的作用是继续VS后面的处理任务——在构建了图形的顶点之后,我们还需要处理图形表面的纹理、像素值颜色等信息,让它们达到预期的效果。简单一-点说,VS是设计师,负责设计楼房的框架;那么PS就是砖瓦匠,它的工作是把楼房盖起来。
  在PS引擎当中如果要细化“工种”,又可以分为像素渲染单元(PixelShader Unit,简称PSU)和纹理贴图单元(Texture MapUnit,简称为TMU)。前者负责像素的一些运算工作,比方说我们在游戏中看到的诸如光影效果、HDR等都是通过PSU来实现的;后者主要负责纹理处理工作,比方说栩栩如生的石头、水面反射以及墙壁贴图等等。
  
  Rop(光栅化引擎):前面我们已经有了设计师和砖瓦匠,但是房子盖起来之后还要有人去卖才行,那么光栅化引擎就是销售人员。ROP引擎负责像素的最终输出工作,执行像素的读/写操作、Z-Buffer检查、色彩混合以及抗锯齿等操作。
  得益于以上三者的大力配合,我们才能在计算机上得到栩栩如生的3D世界。当然,这三部分是我们抽象化之后得到的最基本的概念模型,事实上图形处理芯片中还有很多其它的控制单元,如Setup(设置)引擎等,不过它们对性能的影响并不明显,所以我们这里就省略了。
  在DirectX 8的时代,VS、PS以及ROP单元是1:1:1的关系,即完整的管线在一次处理过程中必须要经过f至少)一次顶点、像素、贴图以及ROP处理。但是在进化到DirectX 9的显卡之后,这个比例被打破了,但是基本的处理过程依然没有发生变化。
  
  编者注:很多时候在一些技术类书籍上,会将ROP单元归到Ps之中,本文为了新手理解方便,将ROP单独提出,独立于PS之外,但这并不表示ROP有独立于PS的特性。
  
  二、管线越多,性能越强?
  
  上文中我们了解了一条最基本图形渲染管线的组成,也就是说一个可以运行的图形处理芯片,最起码应该包含一条完整的渲染管线。但实际的情况是,一条管线很难满足我们的需求,于是多条管线并行处理的结构诞生了。
  俗话说,人多力量大。多管线并行处理也是一样的道理,使用多条管线来完成任务时会显得更有效率。举个例子来说,地上有20块石头,每一辆小车(管线)1分钟只能搬1块,那我们需要20分钟才能搬完;但如果我们有4辆小车(管线),我们用5分钟就可以搬完,效率提高了300%。可见管线数量的多寡确实能够影响到显卡工作时的效率,所以在同级别的显卡中,高端显卡的管线数量就要多于低端的入门级显卡——GeForce 7900GT有24条管线,而GeForce 7300GT只有8条。
  对于同级别的显卡,那自然是管线越多的性能就越好,那要是换作不同时代的显卡呢?仍然用小车的例子,假如我们现在改进了运石头的小车(管线的设计),现在每次可以运走两块石头,那么效率就提高了100%——同样是12管线的GeForce 7600GT和GeForce6800GS,前者就要比后者在性能高出一截,其中管线进化的贡献最为明显(当然肯定没有100%那么夸张)。
  当然,影响显卡性能的因素有很多,比方说显示核心/显存的频率、显存容量,位宽等等。不同的搭配往往会产生不一样的结果,比方说GeForce 7300GT高频版(8管线)甚至可以超过部分GeForce 7600GS(12管线)的性能。但我们仍然可以摸索出一些规律,在同等对比情况下,管线越多的显示芯片性能越高;同样管线数量的情况下,新核心的性能要高于老核心的产品。
  
  三、像素处理单元为何物?
  
  管线数量的增加可以给显卡带来巨大的性能提升,对这一点我们已经深信不疑了。但最近很多新手朋友们在市场上看到“36像素处理单元”的显卡,究竟是怎么一回事呢?这个“像素处理单元”和“管线”又有什么亲缘关系呢?这一切还须从头说起。
  前文中我们介绍了在DirectX 8的时代,显卡中PS:VS:ROP=1:1:1,这是因为当时的显卡管线数量都很少,所以使用这种比例可以很好地兼顾性能和成本。但是随着3D技术的发展,管线各部分负载的压力逐渐不均衡起来。例如VS部分可以很快地完成顶点处理的任务,然后发现PS部分还忙得不亦乐乎,所以数据暂时不能传过去;PS部分运算量太大,既不能接收VS部分的新数据,又不能给后面的ROP输出信号,成为管线中的瓶颈;而后面的ROP部分左顾右盼,却等不到任务来开工……
  在这种情况下,使用更多的PS单元来加强像素和纹理处理工作无疑是非常睿智的选择。PS的数量也成了衡量显卡性能的标准之一。从GeForce 4/Radeon 8x00 时代开始,PSNvs的配置比例就开始不停地变化,例如Radeon 9700为4VS 8PS 8ROP,到了GeForce 6800 Ultra的时候就变成了6VS 16PS 16ROP,到后来的GeForce 7800GTX这个数字又变成了8VS 24PS 16ROP口可以看出从最初的VS:PS=1:1,到后来的1:2,再到1:3,PS单元的重要性在不断加强。
  理论上来说,每个PS单元都应该有一个ROP单元与之配套,但是因为显存位宽等原因,在GeForce7800GTX中虽然有24个PS单元,但是只有16个ROP单元。这也是很多朋友开玩笑说GeForce 7800GTX不是“纯粹”24管线的原因。
  在GeForce 7系列发布之后,当时的ATI(现AMD)也推出了Radeon X1000系列。与以往不同的是,RadeonX1000系列中不再以“管线”的多寡来定义显卡的性能优劣,取而代之的是一个叫做“像素处理单元”的概念。
  按照ATI的说法,游戏的处理过程经过了重纹理,到后来的纹理、像素平衡,再到现在的重像素三个阶段,而且按照游戏渲染(编程方面)的需要,未来的游戏会更加偏重于对像素的处理,而对纹理贴图的要求并没有提高多少。所以ATI决定不再单纯地增加管线数量,而是增加PS单元中PSU的数量。这样做实际上仍然是在加强PS单元的作用,与以往不同的是TMU和PSU的比例发生了变化(TMU并没有随着PSU的增加而增加)。
  这一点实际上NVIDIA也在做,在GeForce7900GTX中PSU的数量实际上是48个(2个一组串行关系),但是NVIDIA仍然按照传统的24个PS单元来标记显卡为24管线;ATI则将Radeon X1950XTX标记为“48像素处理单元(PSU)”,如果按照传统的方式来计算,Radeon X1950XTX采用的是8VS 16PS 16ROP的结构,即16管线。
  PSU的大幅度增加使得ATI的显卡在一些偏重于像素处理的游戏中表现非常抢眼,特别是在复杂的光影转换场景、HDR场景以及开启全屏抗锯齿功能之后,多PSU的优势一览无遗。从整体性能上来看,我们可以简单认为ATI的3:1架构的管线性能’是传统1:1架构管线的1.5倍左右,这种简单的理解也是符合实际测试情况和市场定位的。
  编者注:新手朋友们请注意,这里说的是单条管线的性能,而不是像素处理单元的性能。如果某块ATI芯片的显卡有48个像素处理单元,那么它的管线数应该是48÷3=16条,它的性能大致与NVIDIA同级别的16×1.5=24条管线的产品相当。
  在进入DirectX 10时代之后,传统管线上的VS单元和PS单元逐渐融合,于是出现了一种新的概念“流处理器”。简单来说,就是传统的VS单元和PS单元界限已经没有了,取而代之的是“流处理器”——这个新生事物既可以处理以前VS的工作,也可以处理以前PS的工作,但要注意的是它也不能叫做“管线”。例如,GeForce 8800GTX有128个流处理器,但是我们不能说其有128条“管线”。
  纵观显卡的发展历史,我们发现“管线”的概念正在不断淡化,厂商们更倾向于用与I生能直接相关的PSU乃至流处理器数量来标称显卡档次和定位。而在这新老概念交替的时候,就有一些不良商贩趁机浑水摸鱼,比如把“36像素处理单元’’模糊成“36像素管线”,更有甚者直接说成“36条管线”,搅得新手们摸不清东南西北,只看到数字满天飞。
  在了解了“管线”和PSU的含义之后,我们就可以做到明察秋毫,不会再被数字游戏所蒙骗了。其实无论是PS、VS的变化,还是PSU、TMU的变化,都是综合考虑技术发展的需要,以及实际使用时的负载情况权衡利弊之后才作出的调整。退一步来说,无论是管线数量还是“像素处理单元”的多寡都不是决定显示芯片性能的唯一要素。
  
  四、传统Vs,创新,游戏中见真章!
  
  现在关于ATI多PSU架构与NVIDIA传统架构孰优孰劣的讨论已经到了白热化的地步,双方都有自己的Fans团,两边的Fans公说公有理、婆说婆有理,搞得刚入门的新手们更是丈二和尚摸不着头脑。
  在实际的游戏表现中,两种架构表现出了完全不同的两种趋势。在注重像素运算以及复杂光影效果的游戏中,ATI的显卡由于有多PSU助阵而大放光彩,有时候甚至可超越对手60%以上(同级别产品)。如在《极品飞车卡本峡谷》中,随处可见各种光影效果以及雾化处理的场景,尤其是在打开动态模糊之后,传统架构的NVIDIA显卡几乎都败在同级别的ATI显卡脚下。同样的在《命令与征服3》中,由于游戏中很多场景涉及到激烈的爆炸和光照的效果,像素的运算量非常大,纵然有很多物理贴图需要处理,ATI的显卡仍然将同档次的NVIDIA的显卡比了下去。
  而在另外一些游戏,比方说《帝国时代3》这种对光影要求不是很高,但是需要复杂场景贴图的游戏中,NVIDIA传统架构的显卡又占了上风。因为这类游戏的组成元素非常多,因此在构架模型以及做纹理处理时,对VS乃至TMU的性能需求就非常明显,而ATI显示芯片相对较少的管线数量(实际上是VS以及TMU数量上与NVIDIA产品的差距)就成了游戏的瓶颈。类似的游戏还有《最高指挥官》、《模拟飞行X》等。
  
  写在最后:
  综合来看,NVIDIA和ATI(现AMD)两家公司的产品在DirectX 9.0c的路口走上分岔路。我们不能武断地说那种架构更有优势,因为毕竟殊途还要同归,就最终能够实现的效果来说,二者不分伯仲,只不过是执行效率上的问题。在DirectX 10的时代,我们相信二者还会选择同一种方式(通用的流处理器)。
  就目前而言,新手朋友们在选择显卡时就要根据自己的喜好来投资了。喜欢复杂光影场景、细节出色的游戏,可以站在ATI(现AMD)那边;而喜欢复杂纹理、大场景游戏的,就站在NVIDIA这边。青菜萝卜各有所爱,只有合适的才是最好的!以后再看显卡的时候,不要再被外表的“数字”所迷惑了!
其他文献
我们常说“术业有专攻”,耳机市场也是如此,游戏耳机就是因为游戏玩家越来越多而诞生。而TteSports Shock3D 7.1声道游戏耳机(中文简称震撼者)正是这样一款专为游戏电竟打造的产品。震撼者的机身充满机械感,让人觉得十分坚韧。红与黑的配色很容易把人带入战争、硝烟之中,让游戏的氛围更加充实。耳罩两边的炭黑色外壳看上去像磨砂处理过一样,但摸上去却十分顺滑;Logo在外壳正中的蜂窝状网格里面发出
关注MC的读者一定不会对“混血主板”这个词感到陌生。在主板中混入独立显卡的基因,拥有远超过目前集成芯片组的3D性能,与此同时售价却并未提高多少,相当于“独立显卡免费送”,也难怪众人要为它疯狂了。这块G96MX是翔升最新的一块混血主板,CPU供电部分使用了4相供电,支持最新的Phenom II处理器,北桥与内存都有自己的独立供电单元,用料比较踏实。为了合理控制成本,这块主板在CPU供电单元等重点部位
大容量显存对中高端及以上的显卡作用更加明显,而中低端显卡对大容量显存并不敏感。近日,铭瑄推出了一款1GB显存容量的GeForce 9800 GT显卡,我们不妨来看下1GB显存容量究竟能为它带来多大的性能提升。  铭瑄9800GT终结者1024M采用非公版设计,核心、显存和流处理器频率分别为600MHz/1800MHz/1500MHz。值得一提的是,它,采用了三星1.0ns的显存,但频率却设定得较保
在今年的MWC大展上,三星展示了能够投影50英寸画面的投影手机GALAXY Beam,随后在国内举办的三星中国区规模最大、级别最高的新品发布与高峰对话活动“三星中国论坛”上,GALAXY Beam也以重点新品的角色,出现在大家面前。如果说通过不同的造型与各种用户界面来实现产品的差异化已经为大家所习惯,那么GALAXY Beam带来了全新的“看手机”的方式,则似乎让我们看到了属于手机的另一种未来的发
回放CES 2012展会上的几个镜头,我们会发现很多有趣的现象:  1、英特尔与联想在本次展会上高调发布了首款基于x86架构的智能手机联想K800。联想K800搭载基于x86平台的英特尔单核双线程Atom Z2460芯片,主频达到了1.6GHz。按照英特尔的说法,单核的Atom Z2460已经足以抗衡目前流行的双核ARM处理器,从现场演示1080p高清视频和游戏的流畅程度来看,其性能值得期待。英特
经过2年时间的推广,联想的ThinkPad Edge系列逐渐树立了自己的两大标签—ThinkPad中的潮流先锋及平民英雄。尤其是平民英雄这个属性,使得许多预算有限的用户也能够有机会体验到ThinkPad多年的深厚沉淀。在E320问世之后,希望在便携性、预算以及使用体验之间寻求平衡的用户又多了一个选择。  ThinkPad的产品线已经逐渐形成了高低搭配的风格—高端的经典ThinkPad品牌强调高质高
14英寸的笔记本电脑偏重,13英寸的产品屏幕似乎又小了点……在选购笔记本电脑的时候,你是否也曾纠结于产品的尺寸?毕竟对于不少消费者而言,他们对于笔记本电脑的需求并不是非左即右—既要考虑日常使用中的舒适度,屏幕不能太小,键盘不能太窄,又希望在需要外出使用时,笔记本电脑的重量和大小不会成为负担。接下来要登场的这两款笔记本电脑,正是针对这些需求而出现的一类细分产品。  我们可以把Dell XPS 14z
从去年开始,平板市场就进入了平稳且略带下滑的衰退期。究其原因,与平板自身的产品属性、市场日渐饱和以及缺乏创新等方面都有密切关系。从数据上来看,根据IDC统计,2015年全球平板出货量为2.113亿台,相比去年下滑了8.1%。不过,尽管市场不太景气,平板领域也并非是一潭死水,依1日在硬件技术、产品形态、产品功能等方面寻求着突破。  “芯”技术,英特尔独领风骚  去年平板在处理器方面可谓是“百家争鸣”
随着《基际争霸2:自由之翼》正式版在2010年7月27日的发布,相信各位读者早已投入到歼灭虫族的战斗中。然而在游戏过程中,一些玩家却发现了各种各样的问题,如无法打开抗锯齿来改善画面品质,游戏运行流畅度较低、运行《星际争霸2》后,显卡温度上升很快等现象。接下来本文就将针对以上这些疑难杂症,开具一个切实有效的“处方”,让大家能更好地在《星际争霸2:自由之翼》中毂战斗。    抗锯齿问题缘何而来?   
国庆假期之前,我在网购平台上为全家购买了短途旅游保险后,突然想到这样一件事情,要是真的有什么意外,除了我还有谁知道我购买了保险?购买了什么样的保险?在哪家公司购买了保险呢?于是,我把购买凭证下载下来并打印交给了另外的家人保管以备不时之需。  这件事之后,基于IT行业的我想得更多了一些,在数字化时代,人们的数字财富该如何保管和继承?如果一个人突然因为意外去世,他的网络上的数字财富该如何被亲人所发现和