cpu指令系统的知识产权
中央处理器是电子计算机的主要设备之一。它的功能主要是解释计算机指令和处理计算机软件中的数据。所谓计算机可编程性,主要是指CPU的编程。CPU CPU是电脑中的核心配件,只有火柴盒那么大,几十张纸那么厚,但却是电脑的计算核心和控制核心。CPU负责读取、解码和执行计算机中所有操作的指令。中央处理器、内存和输入输出设备是电子计算机的三个核心部件。同时,中国药科大学的英文缩写也是CPU(中国药科大学)。
不管外表如何,CPU的主要工作原理是执行存储在所谓程序中的一系列指令。这里讨论的是一种遵循通用架构设计的器件。程序以一系列数字的形式存储在计算机内存中。几乎所有CPU的工作原理都可以分为四个阶段:取指、解码、执行和写回。
CPU包括算术逻辑单元、寄存器单元和控制单元。CPU从内存或缓存中获取指令,将它们放入指令寄存器,并对指令进行解码。它将一条指令分解成一系列微操作,然后发出各种控制命令执行微操作系列,从而完成一条指令的执行。指令是计算机指定运算类型和操作数的基本命令。一条指令由一个或多个字节组成,包括一个操作码字段,一个或多个与操作数地址有关的字段,以及一些表示机器状态的状态字和特征码。有些指令还直接包含操作数本身。
1981年,8088芯片首次用于IBM的PC(个人电脑),开创了一个全新的微机时代。也是从8088年开始,PC的概念开始在全球范围内发展。早期的CPU通常是为大型专用计算机定制的。然而,这种为特定应用定制CPU的昂贵方法已经在很大程度上让位于开发适用于一种或多种用途的廉价、标准化的处理器类别。这种标准化趋势始于由单个晶体管组成的大型机和微型计算机时代,并随着集成电路的出现而加速。集成电路使得更复杂的CPU能够在非常小的空间(微米量级)内被设计和制造。1982年,很多年轻读者还在襁褓中的时候,Intel公司已经推出了最新的划时代产品Zao 80286芯片,相比8086和8088有了很大的发展。虽然当时还是16位结构,但是CPU里有134000个晶体管。其内部和外部数据总线均为16位,地址总线为24位,可寻址16MB内存。从80286开始,CPU演变为两种工作模式:实模式和保护模式。CPU 1985,Intel推出80386芯片,这是80X86系列的第一款32位微处理器,制造工艺也有了很大的进步。80386和80286相比,包含了27.5万个晶体管,时钟频率为12.5MHz,之后提高到20MHz,25MHz,33MHz。80386的内部和外部数据总线都是32位,地址总线也是32位,最高可寻址4GB内存。除了实模式和保护模式之外,它还增加了一种叫做虚拟86的工作模式,可以通过同时模拟多个8086处理器来提供多任务能力。除了标准的80386芯片,也就是人们常说的80386DX,出于不同的市场和应用考虑,Intel还陆续推出了一些其他类型的80386芯片:80386SX、80386SL、80386DL等等。1988年,Intel推出了80386SX,这是市场上定位在80286和80386DX之间的芯片。与80386DX的区别在于外部数据总线和地址总线与80286相同,分别为16位和24位(即寻址能力为16MB)。
高速CPU时代的飞速发展
Intel公司推出的CPU 1990、80386 SL、80386 DL都是低功耗节能芯片,主要用于便携式电脑和节能台式机。80386 SL和80386 DL的区别在于,前者基于80386SX,后者基于80386DX,但两者都增加了新的工作模式:系统管理模式。进入系统管理模式时,CPU会自动降低运行速度,控制显示屏、硬盘等部件停止工作,甚至停止运行,进入“睡眠”状态,达到节能的目的。1989年,众所周知的80486芯片由Intel公司推出。这款芯片的伟大之处在于,它实际上打破了1万个晶体管的界限,集成了1.2万个晶体管。80486的时钟频率从25MHz逐渐提高到33MHz和50MHz。80486将80386、数学协处理器80387和一个8KB缓存集成在一个芯片中,80X86系列首次采用RISC(精简指令集)技术,一个时钟周期可以执行一条指令。它还采用了突发总线模式,大大提高了与存储器的数据交换速度。由于这些改进,80486的性能比带有80387数学协处理器的80386DX高4倍。和80386一样,80486也有几种类型。上面介绍的原型号是80486DX。1990年,Intel推出了80486 SX,这是一款486类型的低价机型。它和80486DX的区别在于它没有数学协处理器。80486 DX2采用时钟倍频技术,这意味着芯片内部的运行速度是外部总线的两倍,即内部芯片以两倍于系统时钟的速度运行,但仍以原来的时钟速度与外界通信。80486 DX2的内部时钟频率主要包括40MHz、50MHz和66MHz。80486 DX4也是一款采用时钟倍频技术的芯片,可以让其内部单元以两倍或三倍于外部总线的速度运行。为了支持这种提高的内部工作频率,其片内高速缓存扩展到16KB。80486 DX4的时钟频率为100MHz,比80486 DX2的66MHz快40%。80486还有SL增强型,有系统管理模式,用于便携式电脑或节能台式机。CPU的标准化和小型化,使得这类数码设备(香港翻译为“电子零件”)在现代生活中出现的频率,比应用有限的电脑还要高。现代微处理器出现在从汽车到手机到儿童玩具的所有东西中。奔腾处理器,奔腾时代的中央处理器,1993年3月上市,它集成了365438+万个晶体管。它使用了许多技术来提高cpu性能,包括超标量结构,内置采用超级流水线技术的浮点运算单元,增加片上缓存的容量,以及使用内部奇偶校验来检查内部处理错误。
主频
主频也叫时钟频率,单位是兆赫(MHz)或千兆赫(GHz),用来表示CPU运行和数据处理的速度。CPU主频=外部频率×倍频系数。很多人认为主频决定了CPU的运行速度,这不仅是片面的,对于服务器来说也是偏颇的。到目前为止,还没有一个确定的公式可以实现主频与实际运行速度之间的数值关系。甚至两大处理器厂商Intel和AMD在这一点上也有很大的争议。从英特尔产品的发展趋势可以看出,英特尔非常重视加强自身主频的发展。和其他处理器厂商一样,曾经有人拿一款1GHz的全美达处理器做对比,运行效率相当于2GHz的Intel处理器。CPU主频和实际运行速度有一定的关系,但不是简单的线性关系。所以CPU的主频与CPU的实际运算能力没有直接关系,主频表示的是CPU中数字脉冲信号振荡的速度。在英特尔的处理器产品中,我们也可以看到这样的例子:1 GHz的安腾芯片几乎可以和2.66 GHz的至强/骁龙一样快,或者说1.5 GHz的安腾2大约和4 GHz的至强/骁龙一样快。CPU的运行速度取决于CPU流水线、总线等的性能指标。主频与实际运行速度有关。只能说主频只是CPU性能的一个方面,并不代表CPU的整体性能。
外部频率
外部频率是CPU的参考频率,单位是MHz。CPU的外接频率决定了整个主板的运行速度。一般来说,在台式机中,超频就是超级CPU的外频(当然,一般来说,是锁定CPU的倍频)。我相信这是很好理解的。但是对于服务器CPU来说,超频是绝对不允许的。前面说过,CPU决定主板的运行速度,两者同步运行。如果服务器CPU超频,改变外部频率,就会出现异步运行(很多台式电脑的主板都支持异步运行),造成整个服务器系统的不稳定。目前,在大多数计算机系统中,外部频率和主板前端总线不同步,外部频率和前端总线(FSB)频率很容易混淆。下面前端总线介绍两者的区别。
前端总线(FSB)频率
前端总线(FSB)的频率直接影响CPU与内存直接数据交换的速度。有一个公式可以计算出来,就是数据带宽=(总线频率×数据位宽)/8,数据传输的最大带宽取决于同时传输的所有数据的宽度和传输频率。比如目前支持64位的Xeon Nocona,其前端总线为800MHz。根据公式,其最大数据传输带宽为6.4GB/ s..CPU外频和FSB频率的区别:FSB的速度是指数据传输的速度,外频是指CPU和主板同步运行的速度。换句话说,100MHz的外部频率意味着数字脉冲信号每秒振荡1亿次;100MHz前端总线是指CPU每秒可接受的数据传输容量为100 MHz×64 bit÷8 bit/byte = 800 MB/s,实际上“HyperTransport”架构的出现改变了实际意义上的FSB频率。IA-32架构必须具备三个重要的组件:内存控制器中枢(MCH)、I/O控制器中枢和PCI中枢,比如英特尔的典型芯片组Intel 7501和Intel7505,它们是为双至强处理器量身定制的。它们所包含的MCH为CPU提供了频率为533MHz的前端总线,配合DDR内存,前端总线的带宽可以达到4.3GB/ s,但是随着处理器性能的不断提升,给系统架构带来了很多问题。“HyperTransport”架构不仅解决了问题,还更有效地提高了总线带宽,如AMD皓龙处理器。灵活的HyperTransport I/O总线架构允许它集成内存控制器,使处理器可以直接与内存交换数据,而无需通过系统总线传输到芯片组。在这种情况下,AMD皓龙处理器中的前端总线(FSB)频率不知道从哪里开始。
CPU的位和字长
中央处理器位:数字电路和计算机技术中使用二进制代码,代码只有“0”和“1”,其中“0”和“1”都是CPU中的一位。字长:在计算机技术中,CPU在单位时间内(同时)一次能处理的二进制数的位数称为字长。因此,能够处理字长为8位的数据的CPU通常称为8位CPU。同样,32位CPU在单位时间内可以处理32位二进制数据。字节和字长的区别:由于常用的英文字符可以用8位二进制来表示,所以8位通常称为一个字节。字长的长度不是固定的,对于不同的CPU和字长是不一样的。8位CPU一次只能处理一个字节,而32位CPU一次可以处理四个字节。同样,字长为64位的CPU一次可以处理8个字节。
倍频系数
倍频系数是指CPU主频与外部频率的相对比例关系。在外部频率相同的情况下,倍频越高,CPU频率越高。但实际上,在外部频率相同的前提下,高倍频的CPU本身意义不大。这是因为CPU与系统之间的数据传输速度是有限的,一味追求高频率、获得高倍频的CPU会产生明显的“瓶颈”效应——CPU从系统获取数据的极限速度无法满足CPU运行的速度。一般除了工程样片版的Inter的CPU之外,少部分CPU如奔腾双核E6500K配InterCore 2 core和部分极速版都不锁倍频,AMD之前也不锁。现在AMD推出了CPU黑盒版本(即用户可以自由调节倍频而不锁定倍频版本,调节倍频的超频模式比调节外接频率稳定得多)。
隐藏物
缓存大小也是CPU的重要指标之一,缓存的结构和大小对CPU的速度影响很大。CPU中的缓存运行频率非常高,通常与处理器同频,工作效率远大于系统内存和硬盘。在实际工作中,CPU经常需要重复读取同一个数据块,缓存容量的增加可以大大提高CPU内部读取数据的命中率,而无需在内存或硬盘中寻找,从而提高系统性能。但是由于CPU芯片面积和成本的因素,缓存很小。L1缓存是CPU的第一层缓存,分为数据缓存和指令缓存。内置L1缓存的容量和结构对CPU的性能影响很大。然而,高速缓冲存储器都是由静态RAM构成的,并且结构复杂。在CPU的管芯面积不能太大的情况下,L1级缓存的容量不能做得太大。一般服务器CPU的L1缓存容量通常为32-256 KB。L2缓存是CPU的二级缓存,分为内部和外部芯片。内部芯片二级缓存运行速度与主频相同,而外部二级缓存只有主频的一半。L2缓存容量也会影响CPU的性能。原则是CPU越大越好。以前最大的国产CPU容量是512KB,现在在笔记本电脑上可以达到2M,而服务器和工作站使用的CPU L2缓存更高,达到8M以上。L3缓存(三级缓存)分为两种,早期的外置,现在的内置。其实际作用在于,L3缓存的应用可以进一步降低内存延迟,提高处理器在计算大数据量时的性能。降低内存延迟,提高大数据的计算能力,对游戏很有帮助。但是,通过在服务器领域添加L3缓存,性能仍有显著提高。例如,具有较大L3缓存的配置可以更有效地使用物理内存,因此它可以比较慢的磁盘I/O子系统处理更多的数据请求。具有更大L3缓存的处理器提供了更高效的文件系统缓存行为以及更短的消息和处理器队列长度。其实最早的L3缓存应用在AMD发布的K6-III处理器上。当时L3缓存并没有集成到芯片中,而是由于制造工艺的原因集成到主板中。L3缓存,只能和系统总线频率同步,和主存区别不大。后来,L3缓存是英特尔为服务器市场推出的安腾处理器。然后是P4EE和至强MP。英特尔还计划在未来推出9MB三级高速缓存的Itanium2处理器和24MB三级高速缓存的双核Itanium2处理器。但是L3缓存对于提高处理器的性能并不是很重要。比如配备1MB三级缓存的至强MP处理器,依然不是骁龙的对手,这说明前端总线的增加会比缓存的增加带来更有效的性能提升。
CPU扩展指令集
CPU依赖于来自计算和控制系统的指令,每个CPU都设计有一系列与其硬件电路相匹配的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率最有效的工具之一。从现阶段的主流架构来看,指令集可分为复杂指令集和简化指令集两大部分(指令集* * *,共有四种类型),而从具体应用来看,如英特尔的MMX(Multi Media Extended,这是AMD推测的全称,英特尔没有说明词源)、SSE、SSE 2(Streaming-single instruction multiple data-extensions 2)、SSE3、SSE4系列以及AMD的3DNow!它们都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图像和互联网的处理能力。CPU的扩展指令集通常称为“CPU指令集”。SSE3指令集也是目前最小的指令集。以前,MMX包含57个命令,SSE包含50个命令,SSE2包含144个命令,SSE3包含13个命令。目前SSE4也是最先进的指令集,英特尔酷睿系列处理器已经支持SSE4指令集。AMD将在未来的双核处理器中加入对SSE4指令集的支持,全美达处理器也将支持该指令集。
CPU内核和I/O工作电压
从586CPU开始,CPU的工作电压分为内核电压和I/O电压。通常,CPU的核心电压小于或等于I/O电压。其中,内核电压的大小取决于CPU的生产工艺。一般生产工艺越小,内核的工作电压越低。I/O电压一般为1.6~5V。低电压可以解决功耗过大和发热量过大的问题。
制造工艺
制造工艺的微米是指集成电路中电路之间的距离。制造技术的趋势是向更高密度发展。IC电路设计的密度越高,就意味着在相同尺寸和面积的IC中,你可以拥有更高密度和更复杂功能的电路设计。现在主要的180nm,130nm,90nm,65nm,45 nm。最近inter有了32nm制造工艺的酷睿i3/i5系列。而AMD则表示,其产品将直接跳过32nm工艺(部分32nm产品,如蛇少女、Llano将于20110第三季度生产),28nm产品将于20110年初发布(名称未定)。
包裹
CPU封装是利用特定的材料将CPU芯片或CPU模块固化在其中,防止损坏的一种保护措施。一般CPU只有包装好才能交付给用户。CPU的封装方式取决于CPU的安装形式和器件的一体化设计。从大的分类来说,Socket插座安装的CPU通常采用PGA(网格阵列)封装,而Slot x slot安装的CPU则全部采用SEC(单面插件盒)封装。现在有封装技术,如PLGA(塑料栅格阵列)和奥尔加(有机栅格阵列)。由于市场竞争日益激烈,目前CPU封装技术的发展方向主要是节约成本。
多线程操作
同步多线程同步多线程,简称SMT。SMT通过复制处理器的结构状态,使同一处理器上的多个线程同步执行,共享处理器的执行资源,可以最大限度地实现宽发射和乱序超标量处理,提高处理器运算部件的利用率,缓解数据相关或缓存未命中带来的访存延迟。当没有多线程可用时,SMT处理器几乎与传统的宽发射超标量处理器相同。SMT最吸引人的地方在于,只需小规模改变处理器内核的设计,几乎不增加额外成本,就能显著提升性能。多线程技术可以为高速计算核心准备更多的待处理数据,减少计算核心的空闲时间。这对于桌面低端系统来说无疑是很有吸引力的。从3.06GHz奔腾4开始,所有英特尔处理器都将支持SMT技术。
多心的
多核,也称为芯片多处理器(CMP)。CMP是由美国斯坦福大学提出的。它的思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一个芯片中,每个处理器并行执行不同的进程。与CMP相比,SMT处理器结构的灵活性更加突出。但当半导体工艺进入0.18微米时,线延迟已经超过门延迟,这就要求微处理器的设计要通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,CMP结构被划分为多个处理器核,每个核相对简单,有利于优化设计,因此更有发展前景。目前IBM的Power 4芯片和Sun的MAJC5200芯片都采用了CMP结构。多核处理器可以共享处理器中的缓存,提高了缓存利用率,简化了多处理器系统设计的复杂度。2005年下半年,英特尔和AMD的新处理器也将集成到CMP结构中。全新安腾处理器的开发代号为Montecito,采用双核设计,至少拥有18MB片内缓存,采用90nm工艺制造。它的设计绝对是对当今芯片行业的挑战。它的每个独立内核都有独立的L1、L2和L3缓存,包括大约1亿个晶体管。
CPU制造商
英特尔公司
英特尔是CPU生产的老大哥,它占据了75%以上的市场份额。英特尔生产的带有英特尔标识的CPU已经成为x86CPU事实上的技术规范和标准。最新的PC平台Core 2成为CPU的首选,下一代Core i5、Core i3、Core i7独占鳌头,在性能上大大领先其他厂商的产品。
AMD公司
目前CPU有几家公司的产品。除了英特尔,挑战AMD logo最厉害的就是AMD。最新的AMD速龙二代X2和骁龙二代性价比不错,尤其是采用了3DNOW+技术,支持SSE4.0指令集,使得它们在3D方面表现不错。
IBM和Cyrix
IBM的强项在于高端实验室,工作室的非民用CPU。美国国家半导体公司NS和Cyrix合并后,终于有了自己的芯片生产线,成品也会越来越完善和齐全。现在MII的性能很好,尤其是它的价格很低。
IDT公司
IDT是处理器制造商的后起之秀,但还不成熟。
VIA via公司
威盛(VIA)是中国台湾地区的一家主板芯片组制造商,收购了上述Cyrix和IDT的cpu部门,并推出了自己的CPU。
国产龙芯
龙芯,绰号狗剩,是一款拥有国有自主知识产权的通用处理器。目前已经有两代产品,达到了市面上INTEL和AMD低端CPU的水平。现在龙芯的英文名是loogson。
ARM有限公司
安谋国际科技,少数只授权其CPU设计而不自行制造的公司。嵌入式应用软件通常由ARM架构的微处理器执行。
英特尔奔腾双核:带预处理器内核的奔腾D和奔腾4EE。基本上,普雷斯勒核心是一个简单的产品耦合两个雪松轧机核心在一起。Core 1代采用Yonah核心架构。[1]核心2采用Conroe核心(不完整)。“芯”是领先的节能新型微建筑。设计的出发点是提供出色的性能和能效,提高每瓦性能,也就是所谓的能效比。早期的酷睿是基于笔记本处理器的。
各种包装
散装的只有一个CPU,没有包装。通常商店保修一年。一般是厂家提供给安装商的,安装商不会掉,流入市场。有的经销商把散装CPU配上风扇,包装成原来的样子,就成了周转包。还有另一个主要来源,即走私的散装包裹。CPU是电脑最重要的部分,原包CPU,也叫盒装CPU。原厂包CPU是厂家针对零售市场推出的CPU产品,带原装风扇,厂家三年保修。其实散装CPU和盒装CPU本身并没有质量上的区别。主要区别在于渠道不同,所以保修也不同。盒装CPU基本保修3年,散装CPU只保修1年。盒装CPU配的风扇是原厂包装的风扇,但风扇不是散装配的,还是经销商自己配的。黑匣子CPU是指厂商不锁频的顶级CPU,比如AMD的黑匣子5000+。这种CPU没有风扇,是厂家专门为超频用户推出的零售产品。深封装CPU,又称倒装封装CPU。经销商会自己打包散装CPU,加一个风扇。没有厂家保修,只有门店保修,一般三年。或者从国外走私CPU到国内,进行二次封装,加风扇。这种是免税的,价格比散装的略便宜。工程样片CPU是指处理器厂商在处理器上市前,提供给各大板卡厂商和OEM厂商进行测试的处理器样片。制造出来的产品属于前期,但质量并不低于最终零售的CPU。它最大的特点是,比如不倍频,还有一些特殊功能,所以是掌握DIY的首选。偶尔在市场上也能看到这种CPU,这些工程样品都会标有“ES”(ES =发动机样品的缩写)的生产厂家。