论文部分内容阅读
在整个Pentium4时代,Intel不仅原本并无计划推出64位处理器,甚至连双核计划也没有提上日程。但是,随着AMD的步步紧逼,Intel不得不加快研发的脚步。终于在Core架构下,酷睿2让Intel重新吹响了冲锋的号角。
Core 2 Duo表现令人信服
作为NetBurst的接班人,Core核心架构完全改变了原有的发展模式,CPU不再以牺牲超流水线效率来换取高主频。Core架构的处理器将超流水线缩短到14级,大幅度提升了整体效率,令CPU避免出现“高频低能”的尴尬现象。现在,Intel Core 2 Duo所表现出来的性能已经足够令人信服。当竞争对手还在描绘蓝图上的概念产品之时,Intel显然已经领先一步。
另外值得关注的是,目前双核Core 架构的二级缓存容量高达4~6MB,且两个核心共享,访问延迟仅有12~14个时钟周期。每个核心还拥有32KB的一级指令缓存和一级数据缓存,访问延迟仅仅3个时钟周期。在双核效率方面,Core 架构也将一改直接封装两个核心的低效率方式,而是互相之间可以通过内部总线传输数据并共享缓存,因此性能也大幅度提高。此外,低功耗的智能电源技术(Intelligent Power Capability)和优化多媒体性能的高级数字媒体加速技术(Advanced Digital Media Boost)也将帮助Core核心架构“洗筋伐髓”。
安腾整装待发
在服务器领域,Intel的安腾(Itanium)处理器也有着一定的市场份额,而Montecito则是首款双核安腾2处理器,其中最高规格的型号为9050,它的主频仅为1.6GHz,缓存容量却高达24MB。
安腾处理器最大的特色便是它采用了EPIC结构,即显式并行指令计算集。
EPIC结构使用了超长的指令并将其分割成更小的指令,然后在芯片上进行并行处理。
EPIC设计理念的中心思想是:让智能化的软件指挥愚蠢的硬件,复杂性交给软件处理,硬件只需按序高速并行处理指令和数据。
并行性的表达由每条指令开始,并行性的抽取、调度由编译器实现,从源头起开发指令集的并行ILP。无论何时、无论何处只要可能就利用并行能力,因此效率更加高。
对于那些经常对高速缓存进行操作的应用程序而言,提高缓存命中率是一个很重要的因素。
目前我们使用的CPU在这方面已经做得相当不错,大约有80%以上的命中率。
但是不要忘记,目前主流CPU的总缓存不足4MB,因此这也并没有什么了不起。对于安腾处理器巨大的缓存体系而言,要做到同样的命中率是相当困难的。
为此,双核安腾2使用了“判定”和“预测”技术。这两项技术去掉代码中的分支,进一步改善并行度和数据推测,这使得预测指令将在第一时间知道到底需要哪些数据,并尽量减少处理器的等待时间和内存延迟时间。
此外,双核安腾2处理器还含有大量的寄存器,这大大减少了CPU访问内存的次数,从而为提高缓存命中率提供时间上基本条件。
四核处理器改进在即
目前,Intel已经在PC市场推出了四核处理器,那就是核心代号为Kentsfield的Core 2 Quad。Kentsfield实际上是由两个双核CPU组合而来,这一点很像之前的Smithfield核心,也即90nm Pentium D核心。只不过那是基于NetBurst架构,而Kentsfield是由两个Conroe处理器组成,基于Core架构。
我们建议大家先不要盲目否定组合封装,因为这样做也有很多好处,其中最主要的一点便是简化了生产工艺。
通过这种方式,Intel至少可以降低10%的生产成本。原有的生产线不需升级即可同时完成双核CPU和四核CPU的生产,他们可以在成品中挑选优秀的部分来组合Kentsfield,以达到更佳的功耗性能比,而且也能够保证产量。当然,Intel未来的四核处理器还是会走向一条四核完全独立的发展道路。
以采用45nm工艺的四核版Penryn处理器为例,它将拥有8.2亿个晶体管,核心架构与现有的Core 2有了明显区别。新工艺所带来的好处不仅仅是二级缓存那样简单,而是在架构设计方面可以作出全新的改变。Penryn的核心面积只有107平方毫米,因此芯片的核心面积要比当前65nm Core 2 Quad处理器小25%。
此外,Penryn最高采用1600MHz前端总线设计,桌面版本和移动版本依然支持1333MHz,这令其今后对芯片组的兼容性大幅度提高。
高端版本的Penryn处理器将会内置12MB二级缓存,这些“乍舌”的技术指标都令人对其非常期待。
除了最新的45纳米工艺以外,Intel还将在新款四核处理器上推出被称为“Deep Power Down”的技术,实现更低的C6节电状态。
新的C6节电状态可以将处理器的核心电压降至其所采用制程技术的极限,在该状态下,除了降低处理器核心频率以外,处理器还将关闭所有的高速缓存。在这种情况下,其功耗非常低。
此外,EDAT技术也是Intel在功耗控制上引以为傲的新法宝。这项技术可以单独提高某个处理核心的频率,并将其他暂时不使用的核心关闭,以适应单线程任务或者只能利用一个核心的多线程任务。
链 接:Intel的多核之路
Intel表示,未来的处理器性能已不会像以前那样只注重工作频率,而会趋向多核搭配相关的应用技术,以此来提升实际应用性能。
在8核心(2到4,4到8)以后,Intel就会推出10个核心以上的处理器,未来的处理器更将实现100到1000个核心结合在单芯片上。而要达成这么多的核心设计也必然需要生产制程的配合(如2010年的22nm,2014年的16nm,2016年的11nm和2018年的8nm等)。
Intel方面也将继续以摩尔定律为基准开发处理器产品,晶体管的数量在每代产品将继续倍增:如11nm制程芯片将内置1280亿个晶体管,而到8nm制程时则会有2560亿个晶体管。
Core 2 Duo表现令人信服
作为NetBurst的接班人,Core核心架构完全改变了原有的发展模式,CPU不再以牺牲超流水线效率来换取高主频。Core架构的处理器将超流水线缩短到14级,大幅度提升了整体效率,令CPU避免出现“高频低能”的尴尬现象。现在,Intel Core 2 Duo所表现出来的性能已经足够令人信服。当竞争对手还在描绘蓝图上的概念产品之时,Intel显然已经领先一步。
另外值得关注的是,目前双核Core 架构的二级缓存容量高达4~6MB,且两个核心共享,访问延迟仅有12~14个时钟周期。每个核心还拥有32KB的一级指令缓存和一级数据缓存,访问延迟仅仅3个时钟周期。在双核效率方面,Core 架构也将一改直接封装两个核心的低效率方式,而是互相之间可以通过内部总线传输数据并共享缓存,因此性能也大幅度提高。此外,低功耗的智能电源技术(Intelligent Power Capability)和优化多媒体性能的高级数字媒体加速技术(Advanced Digital Media Boost)也将帮助Core核心架构“洗筋伐髓”。
安腾整装待发
在服务器领域,Intel的安腾(Itanium)处理器也有着一定的市场份额,而Montecito则是首款双核安腾2处理器,其中最高规格的型号为9050,它的主频仅为1.6GHz,缓存容量却高达24MB。
安腾处理器最大的特色便是它采用了EPIC结构,即显式并行指令计算集。
EPIC结构使用了超长的指令并将其分割成更小的指令,然后在芯片上进行并行处理。
EPIC设计理念的中心思想是:让智能化的软件指挥愚蠢的硬件,复杂性交给软件处理,硬件只需按序高速并行处理指令和数据。
并行性的表达由每条指令开始,并行性的抽取、调度由编译器实现,从源头起开发指令集的并行ILP。无论何时、无论何处只要可能就利用并行能力,因此效率更加高。
对于那些经常对高速缓存进行操作的应用程序而言,提高缓存命中率是一个很重要的因素。
目前我们使用的CPU在这方面已经做得相当不错,大约有80%以上的命中率。
但是不要忘记,目前主流CPU的总缓存不足4MB,因此这也并没有什么了不起。对于安腾处理器巨大的缓存体系而言,要做到同样的命中率是相当困难的。
为此,双核安腾2使用了“判定”和“预测”技术。这两项技术去掉代码中的分支,进一步改善并行度和数据推测,这使得预测指令将在第一时间知道到底需要哪些数据,并尽量减少处理器的等待时间和内存延迟时间。
此外,双核安腾2处理器还含有大量的寄存器,这大大减少了CPU访问内存的次数,从而为提高缓存命中率提供时间上基本条件。
四核处理器改进在即
目前,Intel已经在PC市场推出了四核处理器,那就是核心代号为Kentsfield的Core 2 Quad。Kentsfield实际上是由两个双核CPU组合而来,这一点很像之前的Smithfield核心,也即90nm Pentium D核心。只不过那是基于NetBurst架构,而Kentsfield是由两个Conroe处理器组成,基于Core架构。
我们建议大家先不要盲目否定组合封装,因为这样做也有很多好处,其中最主要的一点便是简化了生产工艺。
通过这种方式,Intel至少可以降低10%的生产成本。原有的生产线不需升级即可同时完成双核CPU和四核CPU的生产,他们可以在成品中挑选优秀的部分来组合Kentsfield,以达到更佳的功耗性能比,而且也能够保证产量。当然,Intel未来的四核处理器还是会走向一条四核完全独立的发展道路。
以采用45nm工艺的四核版Penryn处理器为例,它将拥有8.2亿个晶体管,核心架构与现有的Core 2有了明显区别。新工艺所带来的好处不仅仅是二级缓存那样简单,而是在架构设计方面可以作出全新的改变。Penryn的核心面积只有107平方毫米,因此芯片的核心面积要比当前65nm Core 2 Quad处理器小25%。
此外,Penryn最高采用1600MHz前端总线设计,桌面版本和移动版本依然支持1333MHz,这令其今后对芯片组的兼容性大幅度提高。
高端版本的Penryn处理器将会内置12MB二级缓存,这些“乍舌”的技术指标都令人对其非常期待。
除了最新的45纳米工艺以外,Intel还将在新款四核处理器上推出被称为“Deep Power Down”的技术,实现更低的C6节电状态。
新的C6节电状态可以将处理器的核心电压降至其所采用制程技术的极限,在该状态下,除了降低处理器核心频率以外,处理器还将关闭所有的高速缓存。在这种情况下,其功耗非常低。
此外,EDAT技术也是Intel在功耗控制上引以为傲的新法宝。这项技术可以单独提高某个处理核心的频率,并将其他暂时不使用的核心关闭,以适应单线程任务或者只能利用一个核心的多线程任务。
链 接:Intel的多核之路
Intel表示,未来的处理器性能已不会像以前那样只注重工作频率,而会趋向多核搭配相关的应用技术,以此来提升实际应用性能。
在8核心(2到4,4到8)以后,Intel就会推出10个核心以上的处理器,未来的处理器更将实现100到1000个核心结合在单芯片上。而要达成这么多的核心设计也必然需要生产制程的配合(如2010年的22nm,2014年的16nm,2016年的11nm和2018年的8nm等)。
Intel方面也将继续以摩尔定律为基准开发处理器产品,晶体管的数量在每代产品将继续倍增:如11nm制程芯片将内置1280亿个晶体管,而到8nm制程时则会有2560亿个晶体管。