首页系统综合问题Opteron到EPYC, AMD十四年后再度挑战intel

Opteron到EPYC, AMD十四年后再度挑战intel

时间2023-01-18 12:58:48发布分享专员分类系统综合问题浏览264

今天小编给各位分享win7正版7601永久激活密钥的知识,文中也会对其通过Opteron到EPYC, AMD十四年后再度挑战intel和AMD EPYC的模块化和NUMA之路等多篇文章进行知识讲解,如果文章内容对您有帮助,别忘了关注本站,现在进入正文!

内容导航:

  • Opteron到EPYC, AMD十四年后再度挑战intel
  • AMD EPYC的模块化和NUMA之路
  • 详细介绍一下AMD?
  • intel新产品
  • 一、Opteron到EPYC, AMD十四年后再度挑战intel

    在过去很长一段时间内,英特尔在服务器芯片市场以高达99%市场份额处于垄断地位,如同PC市场一样,缺乏竞争的市场环境导致了B端或C端用户的选择缺失,数据中心市场的众多企业和供应商也不得不选择价格居高的服务器产品。

    这种一家独大的局面需要改变,2017年,AMD推出了基于Zen架构的EPYC (霄龙)服务器,再次成为了搅动市场风云的挑战者。

    AMD在服务器市场中算是一位老兵,早在2003年就发布了基于K8构架的Opteron,成为其涉足服务器领域的标志性一步。此后从无到有,AMD凭借Opteron从利润丰厚的服务器芯片市场中夺下了最高至25%的市场份额。但后来由于自身发展受限,又有基于Core 2架构的英特尔Xeon处理器的强势碾压,AMD在服务器市场的份额大量减少。

    就在人们认为AMD在服务器领域的背影早已远去的时候, 2015年在纽约举办的分析师大会上,AMD总裁兼首席执行官苏姿丰(Lisa Su)博士表示,AMD将回归服务器市场。

    2017年3月,AMD正式发布基于Zen架构的Naples服务器芯片, 这是自2003年以来AMD再次向服务器市场发起冲击;

    2017年6月,在美国奥斯汀, 基于Zen架构的AMD全新数据中心处理器品牌EPYC (霄龙)正式发布;

    2017年8月23日,AMD在北京举办了 EPYC 技术峰会,霄龙正式亮相中国市场,并带来了EPYC 7000系列的多款产品。

    契合如今云计算、智能化的发展大势,EPYC (霄龙)处理器的应用范围很广,在高性能计算、云计算、大规模分布式、虚拟化、机器学习、大数据与分析、存储等方面都可适用。并且,EPYC秉承了AMD一贯的高性价比路线,单路系统最高可配置32核心64线程、2TB内存、128条PCIe通道,与intel E5双路产品相比,AMD有更多核心、更多I/O、更大内存和更高的带宽,无论在TCO成本和配置上都有较大的优势。

    EPYC双路系统最高可配置64核心128线程、4TB内存、128条PCIe。

    以下是7000 系列处理器产品

    其中EPYC 7601是其中的旗舰产品,它拥有32核心64线程,128PCIe 3.0通道,8通道DDR4 2666内存,最高3.2GHz智能超频,同等定位的Intel Xeon处理器相比较,性能领先幅度达到了47%。

    EPYC的安全性方面:

    · 安全协处理器(Cortex-A532位微控制器) 运行于独立的安全子系统中,确保片外非易失性存储的安全,提供安全加密功能,并可实现硬件验证启动。

    · 基于硬件的安全内存加密可以保护物理内存免受攻击,单个安全密钥,操作系统/虚拟器管理器可以自己选择需要需要加密的页面,而网络、存储、显卡等硬件设备可以无缝访问加密页面。

    · SEV安全加密虚化让每个虚拟机和管理器都有独立的秘钥,保护其免受其他虚拟机、非法管理员、或不信任虚拟机管理器的伤害。

    EPYC (霄龙)的出现无疑为企业和供应商带来了更多选择,获得了众多产业链合作伙伴的支持。在EPYC 技术峰会现场,来自宏碁、华硕、戴尔、烽火、技嘉、HPE、新华三、英业达、联想、曙光、天地超云、Supermicro、泰安和纬创的嘉宾共同见证了AMD EPYC(霄龙)服务器中国市场的启动庆典。

    大会现场,主要服务器硬件和软件生态系统伙伴Mellanox、红帽软件、Samsung和VMware也共同探讨了如何围绕AMD EPYC(霄龙)处理器进一步扩大产业链合作。

    紧跟云计算、智能化发展需求;高性价比;为市场注入更多活力和空间。十多年后,EPYC (霄龙) 的出现,让AMD迎来了自己在服务器市场的新纪元。一直扮演挑战者角色的AMD,也再一次用行动鞭策对手,鼓舞自身。

    一、AMD EPYC的模块化和NUMA之路

    看起来似乎有强行把芯片设计和数据中心建设拉到一起尬聊的感觉,但世间也没有那么多的一见如故,一些有意义的讨论未尝不是从尬聊开始的。

    就我个人而言,今年已经多次在关于数据中心的文章和(线上)分享中提到AMD:“从1月29日开始到2月6日,腾讯会议每天都在进行资源扩容,日均扩容云主机接近1.5万台,8天总共扩容超过10万台云主机,共涉及超百万核的计算资源投入,全部由腾讯云自研的服务器星星海提供支撑。”这款服务器基于AMD去年8月发布的代号Rome(罗马)的第二代EPYC处理器,最大的特点就是核多——双路配置再算上超线程,一台采用腾讯云定制版EPYC处理器的星星海服务器可以为云服务器提供多达180个核——也就是说,这100万核服务器资源,“只”需要不到6000台该款自研服务器即可满足。

    腾讯云星星海SA2服务器采用2U高度结合类似远程散热片(remote heat-sink)的设计,配合6个60mm风扇,据称可以支持2个300W级别的CPU(AMD第二代EPYC处理器公开版本最高TDP为280W)

    实际上,官方名称为AMD EPYC 7002系列的第二代EPYC处理器最多能提供64个核芯、128个线程,腾讯云定制版本选择了48核芯(96线程)而已。至少在CPU的核数(core count)上,AMD给Intel(英特尔,昵称“大英”)造成了很大的压力。上个月英特尔发布了代号为Cooper Lake的第三代至强可扩展处理器(Xeon Scalable Processor,XSP),主打四路和八路市场,四路配置可提供112核芯224线程,核数上堪与双路EPYC 7002系列抗衡,为10nm制程的Ice Lake争取时间。

    摩尔定律难以延续的后果就是CPU的功耗持续攀升,第一代至强可扩展处理器(公开版)里TDP最高的205W,到第三代已是寻常,250W算是克制——毕竟要考虑四路的散热需求

    话说上一次AMD搞得大英如此狼狈,还要追溯到本世纪初的64位路线之争。众所周知,英特尔是x86及其生态(特别是软件生态)的缔造者,属于“亲妈”级别,AMD充其量是个“后妈”。但是,x86几十年的发展史证明,“亲妈”未必就比“后妈”更了解孩子的发展潜力。也可以前一阵大火的剧集《隐秘的角落》为例,看完就会发现,对于朱朝阳的隐藏能力,后妈的认知似乎先于亲妈。

    Cooper Lake:你看我还有机会吗?

    简单的说,Intel建立发展x86生态,AMD坚定捍卫x86路线——不断改造作为生态核心的x86处理器,焕颜新生

    盛衰无常:架构与制程的双簧

    虽然已经在过去十年中逐渐沦为爱好者口中的“牙膏厂”,但在历史上,英特尔一直不乏创新精神。对待x86的态度可以算是这种精神的一个体现,起码在进入64位时代之前,英特尔其实不太瞧得上x86,总觉得这个娃太low——可能是亲妈更了解孕育过程中的种种先天不足吧——几次三番地在重大的转折点,想要“与时俱进”,重起炉灶,带给用户“船新体验”。反而是AMD屡屡在关键时刻出来捍卫x86,通过翻新加盖来维持其生命力。

    64位是关键的转折点。上世纪九十年代末,还是32位的x86刚“插足”服务器市场不久,英特尔选择与惠普(HP)联手开发基于IA-64架构的Itanium(安腾)作为接班人,与已经64位了的RISC阵营大佬们对抗。然而,AMD认为x86还可以抢救一下,决定通过64位扩展来“续命”,并在2003年4月发布首款64位x86处理器Opteron,两年后又把x86(-64)带入多核时代。

    此时,英特尔已经在IA-64的路上走了十多年。时过境迁,当初设定的目标并没有实现,而x86扩展到64位和多核之后,不仅软件和应用的生态系统得到了完整的继承,性能也完全可以一战。用户用脚投票,大英不得不从。

    第二代EPYC处理器发布会上,Google出示2008年7月9日上线的其第100万台服务器的照片,追诉与AMD的革命友情……还是台四路服务器

    英特尔痛定思痛,决定用架构和制程构筑双保险,在2007年提出了Tick-Tock(取自于时钟的“嘀-嗒”周期)量产模式,即先通过制程升级将芯片面积缩小,是为Tick;再基于操练纯熟的制程改用新的微架构,是为Tock。当时的英特尔工厂在技术和产能上都占据明显优势,只要架构上回到正轨,左右手组合拳一出,产量受限的AMD哪里支撑得住?在2008年推出Nehalem微架构之后,英特尔终于夺回主动权。

    在英特尔施加的强大压力下,AMD在处理器架构上也犯了错误,2011年推出的Bulldozer(推土机)架构采用了即使现在看来也过于激进的模块化设计。随着2012年英特尔开启至强E5时代,AMD在节节失利后不得不退出服务器市场,上一个巅峰期彻底结束。

    有道是:福兮祸所依,祸兮福所伏。先贤曾经曰过:纵有架构、制程双保险,奈何CEO是单点。2016年英特尔推出最后一代至强E5/E7(v4),这是英特尔首批采用14nm制程的服务器CPU,同时也宣告了Tick-Tock模式的终结,改用Process–Architecture–Optimization (制程-架构-优化)的三步走模式。

    在这个可以简称为PAO的模式里,虽然仍是先制程、后架构的节奏,但新加入的优化不管是针对两者中的哪一个还是兼而有之,都起到了拉长制程换代周期的效果。第三代至强可扩展处理器已经是第四波采用14nm制程的服务器CPU,14nm后面的“+”都数不清楚有几个了——还好预计年底发布的Ice Lake将终止这个“土拨鼠之日”式的制程循环。

    架构层面上,从代号Skylake的初代至强可扩展处理器开始,由环形总线改为6×6的2D-mesh,然后持续“优化”。在架构的角度,Mesh和环形总线都属于所谓传统的单片(Monolithic)式架构,优点是整体性好,涉及到I/O的性能比较有保证;缺点是对制程不太友好,随着规模的扩大,譬如核数和Cache的增加,良率上的挑战很大,高端产品的成本下不来,这对于追求高核数的云计算服务提供商显然不是个好消息。


    至强E5/E7 v4的四环(2组双向环形总线)与至强SP的6×6 Mesh架构

    关键时刻,又是沉寂多年的AMD挺身而出,接盘Tick-Tock,以自己的方式“维护”摩尔定律。

    这个方式,就是模块化。

    MCM:同构对等模块化的利与弊

    先简单回顾一下AMD之前的模块化设计为什么会失败。 Bulldozer架构的模块化设计,建立在AMD对未来应用趋势的不靠谱假设上,即整数(Integer,INT)运算将占据绝对主导地位,结论是增加整数运算单元,减少浮点(Floating Point,FP)运算单元。 于是,Bulldozer架构很“鸡贼”的采用了两个(具有完整整数运算单元的)核芯共用一个浮点运算单元的模块化设计,两个模块就可以提供4个核芯(但只有2个浮点运算单元),6核以此类推。

    模块化本身并没有错,Intel Nehalem的模块化设计就很成功。Bulldozer错在“拆东墙补西墙”,结果连补强都算不上

    不用放马后炮,这也是一个妄揣用意(用户意志)的行为。即使是在AI大行其道的今天,第二代英特尔至强可扩展处理器已经支持INT8加速推理运算,也不能和通常意义上CPU的整数运算划等号。贸然押宝,错了当然怪不得别人。

    不难看出,Bulldozer的模块化,与之前Intel Nehalem架构的模块化设计,只限于架构层面,并不是为制程考虑——CPU不论几个模块多少核,都是作为一个整体(die)来制造的,毕竟十年前制程还没到瓶颈。

    然而,到了AMD以代号Naples的(第一代)EPYC处理器重返服务器市场的2017年,摩尔定律放缓的迹象已很明显。同样的14nm(可能还没有英特尔的先进)制程,AMD如何以更低的成本提供更多的核芯?

    EPYC系列处理器基于AMD的Zen系列架构,从Zen、Zen+到Zen 2,以及规划中的Zen 3的发展路线,有点像前面提到的Tick-Tock:开发一个良好的基础然后交替演进,不断优化。

    与先辈们不同,Zen系列的模块化明显侧重于解决制程面对的挑战,即芯片在物理上被切割为多个die(比较小的芯片更容易制造,良率有保证,有利于降低成本),通过Infinity Fabric(IF)互连为一个整体,所以每个die就是一个模块,但不一定是模块化设计的最小单位。

    第一代EPYC处理器的4个die及Infinity Fabric示意

    还是从初代EPYC处理器所采用的Zen架构说起。Zen确立了该系列计算单元模块化的最小单位CCX(Core Complex,核芯复合体),每个CCX包括4个Zen核芯(Core),以及8 MiB共享L3 Cache,每核芯2 MiB。

    从AMD公开的示意图来看,各片(Slice)L3 Cache之间的连接方式像是full-mesh(全网状,即每两个点之间都有直接连接,无需跳转),CCX内部的跨核芯L3 Cache访问是一致的

    Zen的CCD里除了2个CCX,还有2个DDR内存控制器(各对应1个内存通道),用于片上(die之间)互连的Infinity Fabric(IF On-Package,IFOP),而CPU之间互连的Infinity Fabric(IF Inter-Socket,IFIS)与对外的PCIe通道是复用的——这个知识点在后面会用到。

    芯片层面的模块是CCD(Core Complex Die),包括2个CCX,共8个Core、4 MiB L2 Cache、16 MiB L3 Cache。官方名称为AMD EPYC 7001系列的第一代EPYC处理器只有CCD这一种(die层面的)模块,所以每个CCD除了2个CCX,还有大量I/O接口器件,包括DDR、Infinity Fabric/PCIe控制器,CCX占CCD面积的比例只比一半略多(56%)。

    这个多芯片模块(multi-chip module,MCM)架构的代号为Zeppelin(齐柏林),四个这样的“复合型”CCD构成完整的第一代EPYC处理器,最多能提供32核芯、64 MiB L3 Cache,直接减少CCD的数量就会得到面向PC市场的高端(2×CCD)和主流产品(单CCD)。

    按照AMD提供的数据:每个die的面积为213mm²(平方毫米),4个die的MCM封装总面积为852mm²,如果要用大型单一芯片来实现,面积可以缩小到777mm²,大约节省10%,但是制造和测试成本要提高约40%,完全32核的收益下降约17%、成本提高约70%。投入产出比当然非常划算,也变相的说出了大英的苦衷——可是,后者为什么还在坚持单片路线呢?

    MCM这种完全对称的模块化方案,如果套用到数据中心领域,相当于一个园区,几栋建筑结构和功能完全一样,都包含了机房、变配电、柴发、冷站、办公和接待区域等。好处当然是彼此之间没有硬性依赖,每栋建筑都可以独立作为数据中心使用,照此复制就可成倍扩大规模;缺点是没有其他类型的建筑,而有些功能还是需要专门的建筑集中和分区管理的,譬如人员办公和统一接待……

    如果一个数据中心园区只有黄框里这一种建筑(模块)……实际上,加上左边的66KV变电站,这里也只是整个园区的一角

    况且,与绝大多数的数据中心园区不同,CPU对各模块之间的耦合度要求高得多,否则无法作为一个整体来运作,分工合作快速完成数据处理等任务。而这,正是MCM方案的局限性所在。

    第一代EPYC的每个CCD都有“自己的”内存和I/O(主要是PCIe)通道,加上CCD之间的互连,每个CCD的外部I/O都很“重度”

    多芯片(对称)设计、全“分布式”架构的特点是内存和I/O扩展能力与CCD数量同步,随着核芯数量的增加,内存和I/O的总“容量”(包括带宽)会增加,这当然是优点,但缺点也随之而来:

    首先是局部性(locality)会降低I/O的性能,主要是跨CCD的内存访问时延(latency)明显上升。因为每组(2个)CCX都有自己的本地内存,如果要访问其他CCD上连接的内存,要额外花费很多时间,即所谓的NUMA(Non-Uniform Memory Access,非一致性内存访问)。虽然Zen的CCD上有足够多的IFOP,让4个CCD之间能组成全连接(full-mesh),无需经其他CCD跳转(类似于CCX内4个核芯之间的状况),但I/O路径毕竟变长了;如果要访问其他CPU(插槽)连接的内存,还要经过IFIS,时延会进一步上升。

    CCD里的两个CCX也通过Infinity Fabric连接,同样会增加跨CCX的Cache访问时延

    根据AMD提供的数据,不同内存访问的时延水平大致如下:

    随着访问路径变长和复杂,时延以大约一半的比例增加,这个幅度还是很明显的。

    同一个CCD里的内存访问没有明显差异,而跨CCD的内存访问,时延增加就很明显了

    然后是PCIe,前面已经有图说明,Zen用于CPU之间互连的IFIS与PCIe通道是复用的,即单路(单CPU)的情况下全都用于PCIe通道,共有128个;双路(双CPU)的情况下每个CPU都要拿出一半来作为(两者之间的)IFIS,所以(对外的)PCIe通道数量仍然是128个,没有随着CPU数量的增加而增长。

    简单归纳一下,Zen架构的问题是:核数越多,内存访问的一致性越差;CPU数量增加,外部I/O的扩展能力不变——NUMA引发的跨CPU访问时延增长问题还更严重。

    单CPU就能提供128个PCIe 3.0通道原本是第一代EPYC处理器的一大优势,但双CPU仍然是这么多,就略显尴尬了

    核数进一步增加的困难很大,不论是增加每个CCD的核数,还是增加CCD的数量,都要面临互连的复杂度问题,也会进一步恶化一致性。

    说得更直白一些,就是Zen架构的扩展能力比较有限,难以支持更大的规模。

    既然双路配置有利有弊,AMD又是时隔多年重返服务器市场,单路一度被认为是EPYC的突破口,譬如戴尔(Dell)在2018年初推出三款基于第一代EPYC的PowerEdge服务器,其中就有两款是单路。

    1U的R6415和2U的R7415都是单路服务器

    类似的情况在通常用不到那么多核及I/O扩展能力的PC市场体现得更为明显,在只需要一到两个CCD即可的情况下,消费者更多感受到的是低成本带来的高性价比,所以“AMD Yes!”的鼓噪主要来自个人用户,服务器市场在等待EPYC的进一步成熟。

    只有1个die的Ryzen将Zen架构的缺点最小化,获得个人用户的喜爱也就不足为奇了

    Chiplet:异构混合模块化的是与非

    时隔两年之后,AMD推出基于Zen 2架构的第二代EPYC处理器,通过架构与制程一体优化,达到最高64核、256 MiB L3 Cache,分别是第一代EPYC的2倍和4倍,内存访问一致性和双路的扩展性也有不同程度的改善,终于获得了一众云服务提供商(CSP)的青睐。

    Zen 2的整体设计思维是Zen的延续,但做了很多明显的改进,配合制程(部分)升级到7nm,突破了Zen和Zen+在规模扩展上的限制。

    首先,Zen2架构延续了Zen/Zen+架构每个CCD有2个CCX、每个CCX有4个核芯共享L3 Cache的布局,但是每个核芯的L3 Cache增大一倍,来到4MiB,每个CCX有16 MiB L3 Cache,是Zen/Zen+架构的两倍。

    CCD层面的主要变化是把DDR内存、对外的Infinity Fabric(IFOP/IFIS)和PCIe控制器等I/O器件剥离,以便于升级到7nm制程。AMD表示,第一代EPYC中,上述I/O器件占CCD芯片面积的比例达到44%,从制程提高到7nm中获益很小;而第二代EPYC的7nm CCD中,CPU和L3 Cache这些核心计算、存储器件的占比,高达86%,具有很好的经济性。

    被从CCD中拿出来的DDR内存控制器、Infinity Fabric和PCIe控制器等I/O器件,组成了一个单独的I/O芯片,即I/O Die,简称IOD,仍然采用成熟的14nm工艺。

    自左至右,分别是传统单片式、第一代EPYC的MCM、第二代EPYC的Chiplet三种架构的示意图

    一个IOD居中,最多8个CCD围绕着它,AMD把这种做法称为Chiplet(小芯片)。

    如果继续拿数据中心的模块化来强行类比,相当于把整个园区内的变电站、柴发、冷站、办公和接待区域都整合到一个建筑里,位于园区中央,周围是构造完全相同的一座座机房楼……你说,这样一个所有机房楼都离不开的建筑,该有多重要?

    仅从布局看,和第二代EPYC处理器有点像的数据中心,但变电站在园区外,制冷也是分布式的(与4个机房模块在一起),中间的建筑并没有上面设想的那么重要

    第一代EPYC处理器(Naples)与第二代EPYC处理器(Rome)的片上布局对比,后者是1个IOD + 8个CCD,共9个小芯片组成的混合多die设计

    因为CCD的数量增加一倍,所以Rome的核数可以达到Naples的两倍;因为每个CCX/CPU核芯的L3 Cache容量也增加了一倍,所以Rome的L3 Cache总容量可以达到Naples的四倍。

    14nm IOD + 7nm CCD的组合——因为不是全部升级到7nm,所以我更愿意称之为制程的“优化”——体现了更高的扩展性和灵活性,使第二代EPYC能够以较低的制造成本提供更丰富的产品组合,提高了市场竞争力。但是,事情并没有看起来这么简单,要了解产品的具体构成和预期的性能表现,您还需要继续往下看。

    2019年8月,第二代EPYC正式发布后不久,AMD在Hot Chips大会上介绍了Zen 2产品的Chiplet设计。可能是之前有Zen+架构采用12nm制程的缘故吧,IOD的制程被写成了12nm,其他场合的官方材料都是14nm,所以我们还是以后者为准

    今年2月IEEE的ISSCC(International Solid-State Circuits Conference,国际固态电路峰会)2020上,AMD更详细的介绍了Zen 2这一代产品的设计。结合前一幅图可以看到,第二代EPYC的IOD具有83.4亿晶体管,数量与同样采用14nm制程的英特尔Skylake/Cascade Lake相当——虽然两者的晶体管类型构成有很大差别,但可以作为一个参照,说明这个IOD自身的规模和复杂度。

    从红框中的选项来看,EPYC 7302 CPU有4个CCD,每个CCX有2个核芯,可以选择各启用1个

    IOD集中所有I/O器件的一个好处是,CPU能提供的内存通道数量与CCD的数量无关。E企实验室前一阵测试了基于第二代EPYC处理器的Dell PowerEdge R7525服务器,送测配置包括2个AMD EPYC 7302处理器,从PowerEdge R7525的BIOS设置中可以看到,这款16核的CPU有4个CCD(而不是8个),应该对应下图中右二的情形:

    上方柱状图是AMD列出7+14nm Chiplet方案与假设的单片7nm方案相比,成本优势可以达到一半以上(64核没有假设,可能是指单片式很难制造);下方从左至右依次是8、6、4、2个CCD的布局,原则是尽可能的对称

    虽然7302在EPYC 7002系列产品中定位偏低端,只有16个核芯,用4个CCX就能满足,但是它拥有128MiB的L3 Cache,这又需要8个CCX才可以。因此,7302的每个CCX只有2个核芯,享受原本属于4个核芯的16 MiB L3 Cache。

    从EPYC 7002系列的配置表中可以看出,7302下面72开头的产品才是真正的低端,譬如同样是16核的7282,不仅L3 Cache容量只有7302的一半(倒是符合每核4 MiB的“标配”),而且仅支持4个内存通道,也是7302等产品的一半——说明其CCD数量是2个,就像前一幅图右下方所示的情况——4个内存通道配置的运行频率也低,只有DDR4-2667,与标准的8通道DDR4-3200相比,理论内存带宽仅为40%多

    Dell PowerEdge R7525用户手册里对内存条的安装位置有很详细的说明,毕竟插满8个内存通道和只用4个内存通道,性能差距太大

    IOD集中所有I/O对性能也有好处,因为内存控制器集中在一个芯片上,有助于降低内存访问的局部性(NUMA)。不过,AMD在很多场合放出的示意图很有误导性,容易让人以为,对Rome(下图右侧)来说,同一个CPU上的内存访问是不存在NUMA的。

    从上面的数据来看,第二代EPYC处理器的“本地”内存访问时延有所增长,毕竟内存控制器和CCX不在一个die上了;收益是跨CPU内存访问的时延有所下降,总体更为平均

    好在,稍微详细一点的架构示意图表明,一个EPYC 7002系列CPU内部的内存访问仍然会有“远近”之分:

    Dell PowerEdge R7525的BIOS配置中,可以在L3 Cache的NUMA设置为Enabled之后,看到每个CPU内部其实还是可以像EPYC 7001系列一样,分成4个不同的NUMA区域

    这时学术性会议的价值就体现出来。AMD在ISSCC 2020上的演讲表明,完整版的Server IOD要承载的功能太多,已经有太多的晶体管,中间都被Infinity Fabric和PCIe相关的I/O所占据,内存控制器只能两两一组布置在IOD的四角,每2个CCD就近共享2个内存控制器。由于中间已经没有走线空间,只能构成一个没有对角线连接的2D-mesh拓扑——仅从拓扑角度而论,还不如EPYC 7001系列4个CCD的full-mesh连接方式。所以,临近的访问有长短边造成的延迟差异,对角线的内存访问因为要走过一长一短两条边,没有捷径可走,自然要更慢一些。

    注意放大看IOD布局示意图和右侧1~4的不同等级时延注解,可以理解为每个CPU内部仍然分为4个NUMA区域:本地、短边、长边、(拐个弯才能抵达的)对角线

    Hot Chips大会上的这张示意图突出了不同功能的Infinity Fabric导致的IOD中部拥挤,和DDR内存控制器都被挤到边角上的感觉。结合前一张图,不难理解,像EPYC 7282这样只有2个CCD对角线布置的低端SKU,另一条对角线上的4个DDR内存控制器主要起增加内存容量的作用,不如只保留CCD就近的4个内存通道

    总之,不管是EPYC 7001系列的MCM,还是EPYC 7002系列的Chiplet,随着芯片数量的增长,性能肯定会受到越来越明显的影响(而不是近乎线性的同步提升),只是好的架构会延缓总体性能增长的衰减速度。

    这里我们可以回过头来看看同样基于Zen 2架构的第三代AMD Ryzen处理器,主流PC产品没有那么多核数要求,只用2个CCD即可满足,所以其配套的Client IOD(cIOD)正好是Server IOD的四分之一,从前面图中晶体管数量的对比(20.9亿 vs. 83.4亿)也可以看出来。

    代号“Matisse”的第三代Ryzen,仍然可以看到两个DDR4内存控制器偏居一隅的“遗存”,但对两个CCD已经公平了很多,基本不存在NUMA问题。也就难怪“AMD真香”党在消费类用户中比例要大得多

    尽管CCD升级到了7nm,但更多核芯、更大得多的L3 Cache,意味着整体功耗的上升,譬如同样16核的7302和7282,前者Cache大一倍,频率略有提高,默认TDP就来到了155W,Dell为送测的R7525配备了180W的散热器——而EPYC 7282的TDP则“只有”120/150W。当然,CCD应用7nm的效果还是比较明显的,同样16核、L3 Cache只有7302四分之一,运行频率还低500MHz的7301,TDP也有150/170W,基本与7302相当。

    为了满足云计算、高性能计算(HPC)和虚拟化等场景的用户需求,AMD又向EPYC 7002系列CPU中增加了大量多核大(L3) Cache以及核数虽少但频率很高的型号(如今年初发布的7Fx2系列),导致全系列产品中TDP在200W以上的SKU占比很高,也给服务器的散热设计带来了更高的挑战。

    200W+的CPU将越来越常见

    EPYC 7002系列的另一大改进是PCIe从3.0升级到4.0,单路仍然是128个通道,但双路可以支持多达160个通道(譬如Dell PowerEdge R7525的特定配置)——在主板支持的情况下。第一代EPYC处理器推出时的一个卖点是,为其设计的主板也可以支持第二代EPYC处理器。没有广而告之的是,要支持PCIe 4.0,主板需要重新设计。用老主板可以更快的把第二代EPYC处理器推向市场,却不能充分发挥新CPU的全部能力。

    不过,PCIe 4.0本身就是一个很大的话题,留待以后(有机会的话)专文讨论。


    二、详细介绍一下AMD?

    不知道你说的是厂商呢 还是它的产品 都说一下吧 说起AMD不能不提它的冤家对头INTER
    Intel与AMD的竞争似乎从他们成立之初就已经注定。

    1968年,Intel公司成立,随后1969年,AMD公司开始正式营业。两家公司的“斗争”由此开始。1971年,Intel研制的4004作为第一款微处理器开启了微型计算机发展的大门。

    1978年,Intel出产第一颗16位微处理器8086,同时英特尔还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的指令集。人们将这些指令集统一称之为 x86指令集,该指令系统沿用至今。

    接触电脑比较早的人,一定知道早期的计算机表示方法都是按照X86指令集定义,比如286、386、486。当时各个公司出品的CPU都是一个名称,只是打的厂牌不同。

    在微处理器发展初期,Intel提出的X86体系处理器远没有现在风光,当时IBM和苹果公司都推出了微处理器产品,在结构体系上互不相同,但性能差距不大,当时Intel对于AMD以及当时Cyrix等公司的态度十分微妙。一方面他们推出的产品和Intel的产品完全兼容,在市场上对其产品销售有一定影响;另一方面,Intel也在借助这些公司的产品稳固X86体系的地位。

    在Intel与AMD发展的初期,两家公司还有过鲜为人知的合作关系,为X86体系地位的建立做出了很大贡献,随着286 、386的不断推出,特别是到486的时代,x86体系已经雄霸民用微处理器市场,IBM只有在服务器市场坚守着自己的领地,苹果被限制在了某些专业领域维持其独特的风格。

    在这段时间人们对于处理器的品牌概念十分淡漠,当时的消费者只知道购买的的康柏的486或者IBM的486,并不关心处理器的Intel还是AMD。Intel凭借标准提出者的身份,一直是新产品的首发者,并且在市场份额上保持着老大的地位。AMD只能跟在对手背后以完全兼容作为生存的标准,更像是一家生产厂,在竞争上也只能以低价作为俄日裔的手段,这也是为什么AMD一直以来跟人的感觉都是一个“高性价比”品牌,其实就是低价产品的美化说法。

    被迫改变

    1993年,一个值得纪念的年份。在这一年,Intel一改以往的产品命名方式,对于人们认为该命名为586的产品,注册了独立的商标——Pentium(奔腾)。此举不仅震惊了市场,更是给了AMD当头一棒,AMD到了必须走一条新路的时刻。

    从Pentium(奔腾)开始,Intel的宣传攻势不断加强,当时提出的“Intel Inside”口号,现在已经深入人心,经历了Pentium II(奔腾2)和Pentium III(奔腾3)两代产品,Intel已经成为微处理器市场的霸主,一直同AMD并肩作战的Cyrix公司在Intel的强势下无奈选择下嫁VIA公司,退出了市场竞争。

    面对Intel的Pentium(奔腾)系列处理器,AMD在产品上虽有K5、K6等系列对抗,但从性能上一直难与Intel抗衡,只有凭借低廉的价格在低端市场勉强维持生计,眼看着Intel不断扩大其市场占有率。作为一家科技公司,AMD终于醒悟单纯的价格并不能使其产品得到用户的认可,拥有技术才是关键。

    1999年,AMD推出了Athlon系列处理器,一举赢得了业界与消费者的关注,AMD彻底摆脱了自己跟随着的身份,腰身成为敢与Intel争锋的挑战者。也是在这一年,Intel放弃了使用多年的处理器接口规格,AMD也第一次没有跟随Intel的变化,一直沿用原有接口规格,标志着AMD与Intel的竞争进入了技术时代。

    新的开始

    从Athlon开始,AMD似乎找到了感觉,接连在技术上与Intel展开竞争,率先进入G时代,无疑是这一段交锋中,AMD最值得骄傲的一点。在比拼主频的这段时间,不仅让对手再不敢小觑这个对手,也让消费者认识了AMD,市场份额虽然还处在绝对劣势,但是在很多的调查中,AMD已经一举超过Intel成为消费者最关心的CPU品牌。

    接下来AMD发起了一系列的技术攻势,在Intel推出奔奔腾4在主频上与AMD拉开距离后,AMD极力宣传CPU效能概念,在稳住市场的同时还概念了消费者盯住主频的消费习惯,为以后的发展奠定了良好的基础。

    2003年,AMD首先提出了64位的概念,打了Intel一个措手不及。当时64位技术还仅限于高端服务器处理器产品,在民用领域推行64位技术,使AMD第一次作为技术领先者在竞争中取得主动。Intel当时十分肯定地说,64位技术进入民用市场最少还要几年时间,但是1年后,面对市场趋势不得不匆忙宣布推出64位处理器。

    在这次64位的比拼中,AMD无论在时间还是技术上都占有明显优势,可惜天公不作美,由于微软公司的拖沓比预计晚了一年半的时间才推出支持64位的操作系统,而此时Intel的64微处理器也“恰好”上市了,AMD得到了一片叫好声但是“票房”惨淡,所幸AMD也许早料到了这一点,其向下兼容的64位技术在32位应用中性能不俗,没有落得更大遗憾。

    在64位没有取得先机的Intel,在双核处理器上再下文章,领先AMD一个月推出双核产品。AMD现在早已不是当初那个跟在人后的小公司,在推出自己的双核产品后,抛出了真假双核的辩论。

    更令业界震惊的是2005年6月底,AMD毅然把Intel告上了法庭,直指对手垄断行业。对于这场官司的胜负暂且不论,AMD的这种态度已经说明了一切,不再依靠跟随对手,不再依靠低价抢占市场,AMD现在要求的事平等,是站在同一赛场上的对手。

    在法庭外的市场上,AMD再一次拿起了价格这柄利器。在过去的几年中,由于主频竞争发展缓慢,因而Intel公司和AMD公司之间几乎没有进行过大幅度的降价竞争。但是随着双核处理技术的发展,两家公司与业内的其他竞争对手都提高了生产的效率,产品价格重新成为了Intel公司与AMD公司争夺市场的主要战场。

    市场调研机构Mercury Research公布的x86处理器市场2005年第一季调查。结果表示Intel还是这个市场的头龙占市场81.7%,比上季下降0.5%,而AMD为16.9%上升了0.3%,在战斗中两个对手都在不断成长,似乎AMD要走的路还要更远一点。
    产品对比
    AMD与Intel的产品线概述

    AMD目前的主流产品线按接口类型可以分成两类,分别是基于Socket 754接口的中低端产品线和基于Socket 939接口的中高端产品线;而按处理器的品牌又分为Sempron、Athlon 64、Opteron系列,此外还有双核的Athlon 64 X2系列,其中Sempron属于低端产品线,Athlon 64,Opteron和Athlon 64 X2属于中高端产品线。这样看来,AMD家族同一品牌的处理器除了接口类型不同之外,同时还存在着多种不同的核心,这给消费者带来了不小的麻烦。可以说AMD现在的产品线是十分混乱的。与AMD复杂的产品线相比,Intel的产品线可以说是相当清晰的。Intel目前主流的处理器都采用LGA 775接口,按市场定位可以分成低端的Celeron D系列、中端的Pentium 4 5xx系列和高端的Pentium 4 6xx系列、双核的Pentium D系列。除了Pentium D处理器以外,其他目前在市面上销售的处理器都是基于Prescott核心,主要以频率和二级缓存的不同来划分档次,这给了消费者一个相当清晰的印象,便于选择购买。(鉴于目前市场上销售的CPU产品都已经全面走向64位,32位的CPU无论在性能或者价格上都不占优势,因此我们所列举的CPU并不包括32位的产品。同样道理,AMD平台的Socket A接口和Intel的Socket 478接口的产品都已经在两家公司的停产列表之上,而AMD的Athlon 64 FX系列和Intel的Pentium XE/EE系列以及服务器领域的产品也不容易在市面上购买到,因此也不在本文谈论范围之内。)

    2. AMD与Intel产品线对比

    双核处理器可以说是2005年CPU领域最大的亮点。毕竟X86处理器发展到了今天,在传统的通过增加分支预测单元、缓存的容量、提升频率来增加性能之路似乎已经难以行通了。因此,当单核处理器似乎走到尽头之际, Intel、AMD都不约而同地推出了自家的双核处理器解决方案:Pentium D、Athlon 64 X2!

    所谓双核处理器,简单地说就是在一块CPU基板上集成两个处理器核心,并通过并行总线将各处理器核心连接起来。双核其实并不是一个全新概念,而只是CMP(Chip Multi Processors,单芯片多处理器)中最基本、最简单、最容易实现的一种类型。

    处理器协作机制:

    AMD Athlon 64 X2

    Athlon 64 X2其实是由Athlon 64演变而来的,具有两个Athlon 64核心,采用了独立缓存的设计,两颗核心同时拥有各自独立的缓存资源,而且通过“System Request Interface”(系统请求接口,简称SRI)使Athlon 64 X2两个核心的协作更加紧密。SRI单元拥有连接到两个二级缓存的高速总线,如果两个核心的缓存数据需要同步,只须通过SRI单元完成即可。这样子的设计不但可以使CPU的资源开销变小,而且有效的利用了内存总线资源,不必占用内存总线资源。

    Pentium D

    与Athlon 64 X2一样,Pentium D两个核心的二级高速缓存是相互隔绝的,不过并没有专门设计协作的接口,而只是在前端总线部分简单的合并在一起,这种设计的不足之处就在于需要消耗大量的CPU周期。即当一个核心的缓存数据更改之后,必须将数据通过前端总线发送到北桥芯片,接着再由北桥芯片发往内存,而另外一个核心再通过北桥读取该数据,也就是说,Pentium D并不能像Athlon 64 X2一样,在CPU内部进行数据同步,而是需要通过访问内存来进行同步,这样子就比Athlon 64 X2多消耗了一些时间。

    二级缓存对比:

    二级缓存对于CPU的处理能力影响不小,这一点可以从同一家公司的产品线上的高低端产品当中明显的体现出来。二级缓存做为一个数据的缓冲区,其大小具有相当重大的意义,越大的缓存也就意味着所能容纳的数据量越多,这就大大地减轻了由于总线与内存的速度无法配合CPU的处理速度,而浪费了CPU的资源。

    事实上也证明了,较大的高速缓存意味着可以一次交换更多的可用数据,而且还可以大大降低高速缓存失误情况的出现,以及加快数据的访问速度,使整体的性能更高。

    就目前而言,AMD的CPU在二级高速缓存的设计上,由于制造工艺的原因,还是比较小,高端的最高也只达到2M,不少中低端产品只有512K,这对于数据的处理多多少少会带来一些不良的影响,特别是处理的数据量较大的时候。Intel则相反,在这方面比较重视,如Pentium D核心内部便集成了2M的二级高速缓存,这在处理数据的时候具有较大的优势,在高端产品中,甚至集成4M的二级高速缓存,可以说是AMD的N倍。在一些实际测试所得出来的数据也表明,二级缓存较大的Intel分数要高于二级缓存较小的AMD不少。

    内存架构对比:

    由Athlon 64开始,AMD便开始采用将内存控制器集成于CPU内核当中的设计,这种设计的好处在于,可以缩短CPU与内存之间的数据交换周期,以前都是采用内存控制器集成于北桥芯片组的设计,改成集成于CPU核心当中,这样一来CPU无需通过北桥,直接可以对内存进行访问操作,在有效的提高了处理效率的同时,还减轻了北桥芯片的设计难度,使主板厂商节约了成本。不过这种设计在提高了性能的同时,也带来了一些麻烦,一个是兼容性问题,由于内存控制器集成于核心之内,不像内置于北桥芯片内部,兼容性较差,这就给用户在选购内存的时候带来一些不必要的麻烦。

    除了内存兼容性较差之外,由于采用核心集成内存控制器的缘故,对于内存种类的选择也有着很大的制约。就现在的内存市场上来看,很明显已经像DDR2代过渡,而到目前为止Athlon 64所集成的还只是DDR内存控制器,换句话说,现有的Athlon 64不支持DDR2,这不仅对性能起到了制约,对用户选择上了造成了局限性。而Intel的CPU却并不会有这样子的麻烦,只需要北桥集成了相应的内存控制器,就可以轻松的选择使用哪种内存,灵活性增强了不少。

    还有一个问题,如若用户采用集成显卡时,AMD的这种设计会影响到集成显卡性能的发挥。目前集成显卡主要是通过动态分配内存做为显存,当采用AMD平台时,集成在北桥芯片当中的显卡核心需要通过CPU才能够对内存操作,相比直接对内存进行操作,延迟要长许多。

    平台带宽对比:

    随着主流的双核处理器的到来,以及945、955系列主板的支持,Intel的前端总线将提升到1066Mhz,配合上最新的DDR2 667内存,将I/O带宽进一步提升到8.5GB/S,内存带宽也达到了10.66GB/S,相比AMD目前的8.0GB/S(I/O带宽)、6.4GB/S(内存带宽)来说,Intel的要远远高出,在总体性能上要突出一些。

    功耗对比:

    在功耗方面,Intel依然比较AMD的要稍为高一些,不过,近期的已经有所好转了。Intel自推出了Prescott核心,由于采用0.09微米制程、集成了更多的L2缓存,晶体管更加的细薄,从而导致漏电现象的出现,也就增加了漏电功耗,更多的晶体管数量带来了功耗及热量的上升。为了改进Prescott核心处理器的功耗和发热量的问题,Intel便将以前应用于移动处理器上的EIST(Enhanced Intel Speedstep Technolog)移植到目前的主流Prescott核心CPU上,以保证有效的控制降低功耗及发热量。

    而AMD方面则加入了Cool ‘n’ Quiet技术,以降低CPU自身的功耗,其工作原理与Intel的SpeedStep动态调节技术相似,都是通过调节倍频等等来实现降低功耗的效果。

    实际上,Intel的CPU功率之所以目前会高于AMD,其主要的原因在于其内部集成的晶体管远远要比AMD的CPU多得多,再加上工作频率上也要比AMD的CPU高出不少,这才会变得功率较大。不过在即将来临的Intel新一代CPU架构Conroe,这个问题将会得到有效的解决。其实Conroe是由目前的Pentium M架构变化而来的,它延续了Pentium M的绝大多数优点,如功耗更加低,在主频较低的情况下已然能够获得较好的性能等等这些。可以看出,未来Intel将把移动平台上的Conroe移植到桌面平台上来,取得统一。

    流水线对比:

    自踏入P4时代以来,Intel的CPU内部的流水线级要比AMD的高出一些。以前的Northwood和Willamette核心的流水线为20级,相对于当时的PIII或者Athlon XP的10级左右的流水线来说,增长了几乎一倍。而目前市场上采用Proscott核心CPU流水线为31级。很多人会有疑问,为何要加长流水线呢?其实流水线的长短对于主频影响还是相当大的。流水线越长,频率提升潜力越大,若一旦分支预测失败或者缓存不中的话,所耽误的延迟时间越长,为此在Netburst架构中,Intel将8级指令获取/解码的流水线分离出来,而Proscott核心有两个这样的8级流水线,因此严格说起来,Northwood和Willamette核心有28级流水线,而Proscott有39级流水线,是现在Athlon 64(K8)架构流水线的两倍。

    相信不少人都知道较长流水线不足之处,不过,是否有了解过较长流水线的优势呢?在NetBurst流水线内部功能中,每时钟周期能够处理三个操作数。这和K7/K8是相同的。理论上,NetBurst架构每时钟执行3指令乘以时钟速度,便是最后的性能,由此可见频率至上论有其理论基础。以此为准来计算性能的话,则K8也非NetBurst对手。不过影响性能的因素有很多,最主要的就是分支预测失败、缓存不中、指令相关性三个方面。

    这三个方面的问题每个CPU都会遇到,只是各种解决方法及效果存在着差异而已。而NetBurst天生的长流水线既是它的最大优势,也是它的最大劣势。如果一旦发生分支预测失败或者缓存不中的情况,Prescott核心就会有39个周期的延迟。这要比其他的架构延迟时间多得多。不过由于其工作主频较高,加上较大容量的二级高速缓存在一定程度上弥补了NetBurst架构的不足之处。不过流水线的问题在Intel的新一代CPU架构Conroe得到了较好的解决,这样子以来,大容量的高速缓存,以及较低的流水线,配合双核心设计,使得未来的Intel CPU性能更加优异。

    “真假双核”

    在双核处理器推广的过程中,我们听到了一些不和谐的音符:AMD宣扬自己的双核Opteron和Athlon-64 X2才符合真正意义上的双核处理器准则,并隐晦地表示Intel双核处理器只是“双芯”,暗示其为“伪双核”,声称自己的才是“真双核”,真假双核在外界引起了争议,也为消费者的选择带来了不便。

    AMD认为,它的双核之所以是“真双核”,就在于它并不只是简单地将两个处理器核心集成在一个硅晶片(或称DIE)上,与单核相比,它增添了“系统请求接口”(System Request Interface,SRI)和“交叉开关”(Crossbar Switch)。它们的作用据AMD方面介绍应是对两个核心的任务进行仲裁、及实现核与核之间的通信。它们与集成的内存控制器和HyperTransport总线配合,可让每个核心都有独享的I/O带宽、避免资源争抢,实现更小的内存延迟,并提供了更大的扩展空间,让双核能轻易扩展成为多核。

    与自己的“真双核”相对应,AMD把英特尔已发布的双核处理器——奔腾至尊版和奔腾D处理器采用的双核架构称之为“双芯”。AMD称,它们只是将两个完整的处理器核心简单集成在一起,并连接到同一条带宽有限的前端总线上,这种架构必然会导致它们的两个核心争抢总线资源、从而影响性能,而且在英特尔这种双核架构上很难添加更多处理器核心,因为更多的核心会带来更为激烈的总线带宽争抢。

    而根据前面我们提到CMP的概念,笔者认为英特尔和AMD的双核处理器,以及它们未来的多核处理器实际上都属于CMP架构。而对双核处理器的架构或标准,业界并无明确定义,称双核处理器存在“真伪”纯属AMD的一家之言,是一种文字游戏,有误导消费者之嫌。

    目前业界对双核处理器的架构并没有共同标准或定义,自然也就没有什么真伪之分。CMP的原意就是在一个处理器上集成多个处理器核心,在这一点上AMD与英特尔并无分别,不能说自己的产品集成了仲裁等功能就是“真双核”,更没有理由称别人的产品是“双芯”或“伪双核”。此外在不久前AMD举办的“我为双核狂”的活动中,有不少玩家指出,AMD的双核处理器在面对多任务环境下,无法合理分配CPU运算资源,导致运行同样的程序却会得到不同的时间,AMD的双核并不稳定。从不少媒体的评测还可以看到,AMD的双核在单程序运行的效率要高于Intel处理器,但是在多任务的测试中则全面落后!

    由此可见,对于真假双核之说,笔者认为只是一种市场的抄作,并不是一种客观的性能表现。从真正的双核应用上来看(双核的发展主要是由于各种程序的同时运行,即多程序同时运行的要求),Intel的双核更符合多程序的发展需求。

    高性能的基石——Intel及AMD平台对比

    二、高性能的基石——Intel及AMD平台对比

    看完上面的介绍,我们可以看到无论Intel还是AMD都提供了丰富的产品,而至于二者在处理器架构上的优劣毕竟不是片言只字可以言明,也不可以片面的说谁的架构更为优胜,因为二者都有各自的优势之处,也有其不足。但无论如何,对于CPU来说,一个产品优秀与否,性能如何,都必须要有其发挥的平台,接下来,我们来看看两家产品的主流平台。

    1. 平台对比之Intel篇

    在刚过去的2005年中,Intel处理器在产品规格与规划两方面对整个芯片技术的发展都做出了巨大的贡献,对用户的最终选择有着直接的影响。首先,尽管LGA775接口较脆弱的问题曾一度过引发争议,但桌面级CPU从Socket 478向LGA 775过渡已是不可逆转;其次,处理器的FSB频率再一次被拉高,1066MHz已成为新一代处理器的标准;再次,双核CPU的上市引发了不小的轰动,普及也只是时间的问题。与之对应,第一代LGA 775接口芯片组——Intel 915/925系列已是昨日黄花,945/955系列已经作为新的主流取而代之。集成HD音效技术、双通道DDR2内存架构、千兆网卡、SATA2技术,RAID5等一系列过去只能在高端主板上才有的技术现在已经成为标准配置。在PCI-E显卡接口已经成为市场主流的时候,市场上有了更多的厂商加入其中,Intel芯片组一家独大的情况已经有所改变,NVIDIA和ATI都推出了相应产品,功能规格毫不逊色;VIA和SIS等台系厂商也有其“特色产品”,市场空前繁荣。 Intel Intel处理器搭配Intel芯片组一向是DIYer的首选。2005年,Intel沿袭了其一贯的特点:新品推出速度快,档次定位明确,新技术大量使用等等。目前Intel的高端桌面芯片组当属955X和975X系列,作为高端产品,955X具备了945系列的主要功能,但抛弃了过时的533MHz FSB。加之其支持8GB内存、ECC校验技术和内存加速技术,这些特点令其与主流产品拉开了距离。975X则是955X的加强版,可以完美支持Intel所有桌面处理器,包括Pentium EE。更重要的是支持双PCI-E 8X显卡并行技术。925X/XE是上一代的高端产品,但由于缺乏对双核心的支持,令其瞬间失势。

    主流市场一向是Intel的中流砥柱。945系列是其巩固这一市场的利器,包括945P/PL/G/GZ等型号,分别用于不同需求的用户。945系列支持FSB 533-1066的处理器,包括Celeron D、Pentium 4和Pentium D等在内的Intel主流CPU,945系列已全面转向DDR2,并支持Intel Flex Memory技术,可使不同容量的内存构成双通道模式,兼容性得以提高。

    随着945系列的大量铺货,曾经的主流产品915系列不可避免的被推到低端市场。915系列包括915P/PL/G/GV/GL五种型号,针对不同的用户,但目前该系列产品存在不同程度的缺货,售价与945系列相差也不是太大,而且也传言Intel即将将其停产,故不推荐购买。

    NVIDIA目前NVIDIA发布的Intel平台的芯片组有NF4 SLI IE,NF4 SLI XE,NF4 Ultra等几款,都是作为中高端产品出现在市场的,其中的NF4 SLI IE更是第一个把NVIDIA在AMD平台上无限风光的SLI技术引入了INTEL平台,让INTEL平台也能实现双显卡运作的模式。而更具革命性的是,NF4 SLI IE芯片组在打开双显卡模式的时候,能够运行在PCI-E 16X+16X的高显示带宽之上,性能提升效果更加明显。这样的技术优势,即便是说AMD平台上的NF4 SLI芯片组也已经难以实现(NF4 SLI只能打开PCI-E 8X+8X的带宽),缺乏技术授权的众INTEL芯片组更是无可奈何。

    ATI目前ATI在Intel平台的主力芯片组是Radeon Xpress 200 For Intel platforms系列,而支持交火技术的Radeon Xpress 200 CrossFire则定位高端。Radeon Xpress 200 For Intel platforms芯片组的主板采用南北桥分离设计,包括RS400、RC400、RC410和RXC410四款产品。北桥集成X300显示核心,并具备Intel平台的几乎所有主流技术支持,兼容性十分强大。Radeon Xpress 200 CrossFire在Intel平台的产品称作RD400,基本架构与RS400相仿,最大的特点是支持ATI的CrossFire显卡并行技术。但ATI的自家的南桥功能有限,众多厂商会采用ULi M1573/1575替代作为折衷方案。

    VIA、SIS VIA和SiS在Intel平台也是有相当资历的元老级芯片组生产商,二者主要为Intel平台提供中低端的产品。VIA目前在Intel平台的主要产品有PT880 PRO和PT894,集成显卡的最新产品为P4M890。SiS则提供SiS 656/649等产品。 2. 平台对比之AMD篇

    随着K7核心退出历史舞台,K8处理器已经顺利完成过渡。与此同时,Socket 754和Socket 939平台也发生着分化——Socket939定位于主流桌面和入门级服务器市场,Socket 754则定位于低端平台。与之搭配的芯片组延续着显示核心市场的明争暗斗——NVIDIA于ATI的大战愈演愈烈,加上久经沙场的VIA和SiS,AMD处理器配套芯片组市场从未如此热闹。

    NVIDIA

    NVIDIA是AMD平台中芯片组最多的一家厂商,从集成显示核心的入门级产品到支持显卡并行技术的高端产品都可以找到NVIDIA的身影。可以说NVIDIA芯片组是AMD平台中占绝大部分市场份额的产品,也是众多DIYer眼中AMD处理器的最佳搭档。

    目前NVIDIA在AMD平台的芯片组包括NF4-4X、NF4标准版、NF4 Ultra、NF4 SLI以及整合图形核心的C51系列。其中NF4-4X主要采用Socket 754接口,针对低端及入门级用户,主要搭配Socket 754接口的Sempron和Athlon 64处理器。NF4 Ultra和NF4 SLI则主要采用Socket 939接口,针对中高端用户。其中部分产品更是用料十足,配置豪华,是骨灰级玩家的选择。C51系列包括C51G(GeForce 6100)和C51PV(GeForce 6150)两种北桥芯片,搭配nForce 410 MCP和nForce 430 MCP两种南桥,为AMD提供整合显示芯片的主板。其集成的显示芯片性能已经不再是鸡肋,紧跟主流显卡脚步。

    ATI

    ATI作为NVIDIA在显卡市场的主要竞争对手,在AMD平台中的角色也非常强,但竞争力就要比在显卡市场下降不少。作为对NVIDIA SLI技术的回应,ATI推出了Crossfie芯片组与之抗衡,而且其双显卡并行的限制比SLI要宽松很多, Crossfie技术对游戏的兼容性很好,几乎每款游戏都可以从中获得性能提升。但目前在市面上可以买到的Crossfie主板远没有SLI的多,ATI在这方面推广力度似乎不够。此外在中低端市场,ATI提供了Radeon Xpress 200系列,包括整合显示核心的RS480/482和采用独立显卡的RX480,支持单PCI-E x16显卡插槽,支持两个以上的SATA接口,支持千兆网卡,性能中规中举。

    平台综述

    目前市场上Intel和AMD平台的主要产品都已经略为介绍,我们可以看到,AMD处理器目前使用的芯片组绝大多数由其合作伙伴设计,比如nVidia、ATI、VIA等等,他们设计好后再找其他企业代工生产。这样一来,AMD在实际的市场操作方面就有很多困难,比如说在平台的整体价格控制方面无法做到统一调控,另外很可能会出现主板供应跟不上CPU的市场出货率,或者大于CPU的供应量等等。虽然AMD本身也有配合自己产品的平台,但是高昂的成本、不实用的功能也只能使它成为评测室中的一道风景。

    从另外一个角度看,AMD的主流处理器产品拥有Socket 754和Socket 939两个平台,而在两个平台的产品针对不同的消费者

    三、intel新产品

    楼主你好

    冒昧的问句楼主你还停留在奔腾的时代吗?不是的话应该不会这么说,

    酷睿2双核处理器满足工作和娱乐,采用的先进架构,配备大量的二级缓

    存,众多技术指令的集成,智能化的管理实现了“高能底耗”。决不是

    K8架构可以相比,他们不是同一档次的产品,也可以说他们不是同一时

    代的。K8唯一的优势就是价格便宜,配置的平台不用花太多钱,其实玩

    游戏AMD和INTEL的都不差什么,连续的浮点运算对游戏并没多大影响,

    主要看显卡。办公INTEL 游戏AMD 已经过时。

    AMD 今年第二季度好象就要推出 K10双核的产品了

    intel 今年有什么新动向吗?有什么新产品吗?

    AMD在2007年10月分左右就推出K10四核处理器,在欧美等地推出服务器

    的,还没桌面处理器,架构设计的不好,三级缓存有漏洞,性能不好,

    连Q6600也比不过。(Q6600是INTEL最底端的四核处理器)AMD开始修复

    三级缓存,准备在2008推出K10桌面处理器。

    INTEL方面自从2006年7月24日对AMD发动“恐怖袭击”,AMD一落千丈产

    品掉价平均高达50%,也造就K8的性价比高这一辉煌,事实上AMD一直赔

    钱。INTEL在2008年继续打击AMD推出了以45NM工艺的CPU已经推出:

    INTEL Core2 Q9300 INTEL Core2 Q9450 INTEL Core2 Q9550

    INTEL Core2 QX9775 INTEL Core2 QX9770 INTEL Core2 QX6700

    INTEL Core2 QX9650

    都是酷睿2四核系列处理器(CPU)

    INTEL准备在2008年再次进入显卡市场,准备全方位打击AMD和完善自己

    的平台,顺利的话预计在2009年上市。那么2008年

    就是个45NM年

    关于win7正版7601永久激活密钥的问题,通过《详细介绍一下AMD?》、《intel新产品》等文章的解答希望已经帮助到您了!如您想了解更多关于win7正版7601永久激活密钥的相关信息,请到本站进行查找!

    爱资源吧版权声明:以上文中内容来自网络,如有侵权请联系删除,谢谢。

    win7正版7601永久激活密钥
    在美国开车这些需要注意 电气工程英文词汇编录