全文浏览
近年来Intel CPU架构回顾
一切的开端:Nehalem
Lynnfield核心示意图
08年推出的Nehalem微架构是一切的基础,Intel这几年的酷睿处理器微架构都是以它为基础,严格来说,Nehalem微架构仍是基于上一代Core微架构改进而来的,但它的改进是全方位的,计算内核的设计来源于之前的Core微架构,并对其进行了优化和加强,主要为重拾超线程技术、支持内核加速模式Turbo Boost和支持SSE4.2等方面,非计算内核的设计改动主要的有三级包含式Cache设计、使用QPI总线和整合内存控制器等重要改进。
Nehalem微架构采用可扩展的架构,主要是每个处理器单元均采用了Building Block模组化设计,组件包括有:核心数量、SMT功能、L3缓存容量、QPI连接数量、IMC数量、内存类型、内存通道数量、整合GPU、 能耗和时钟频率等,这些组件均可自由组合,以满足多种性能需求,比如可以组合成双核心、四核心甚至八核心的处理器,而且组合多个QPI连接更可以满足多路服务器的需求。
正因为这样的模组化设计,英特尔可以灵活的制造出各种差异化的核心,比如支持三通道DDR3的Bloomfield核心、支持双通道DDR3的Lynnfield和Clarkdale核心,而且这些核心间还存在是否支持超线程、Turbo Boost技术等区别,Clarkdale还整合了GPU图形单元。
在2009年9月,Intel推出基于Nehalem微架构的Lynnfield处理器,采用LGA 1156接口,它与Bloomfield的区别不单只在于内存通道数的差别,Lynnfield把PCI-E控制器整合到了CPU内部,而北桥其他功能与南桥一起整合到PCH里面,主板从三芯片变成了双芯片,形成了现在主板的基本布局。
2010年的Clarkdale只有双核设计,它把GPU也整合到CPU内部了,但是只是简单的将GPU和CPU封装在一起,并没有真正达到“融合”,一颗CPU里其实有两颗“芯”i7,CPU的制造工艺升级到了32nm而GPU部分则依然是旧的45nm工艺,它们采用QPI总线相连,对外则采用DMI总线连接PCH。
真正的双芯融合:Sandy Bridge
Sandy Bridge核心示意图
在2011年伊始,Intel就把微架构升级到新一代的Sandy Bridge,它真正将GPU与CPU融合,从以前的双U各立山头到合二为一,是非常大的突破,内核架构也较Nehalem有了较大变化,这些变化包括:新的分支预测单元、新的Uop缓存、新的物理寄存器文件、有效执行256位指令、放弃QPI总线改用环形总线、最末级缓存LLC机制、新鲜的系统助理等。
AVX指令集的加入是Sandy Bridge最为重要的改进,浮点性能得以激增,新一代的Turbo Boost 2.0技术增强了Sandy Bridge自动提速的弹性,除CPU外还可对GFX进行加速,并随着系统负载的不同协调二者的频率升降,表现得更加智能化。
新一代图形核心具备出色的图形与多媒体性能,由于改用了环形总线设计,三级缓存可由CPU各核心、GPU核心与系统助理System Agent共享,可直接在L3内进行通信。GPU主要包含了指令流处理器、媒体处理器、多格式媒体解码器、执行单元、统一执行单元阵列、媒体取样器、纹理采样器以及指令缓冲等等,架构与上一代相比有了较大修改。
3D晶体管起航:Ivy Bridge
Ivy Bridge核心示意图
Ivy Bridge虽然说只是Sandy Bridge的工艺改良版i7,架构上没太大改变,不过对Intel来说却是一款相当重要的产品,因为它是首次采用22nm 3D晶体管工艺,是今后Intel半导体工艺的重要基础;另外CPU内部的PCI-E控制器也升级到了PCI-E 3.0标准,带宽提升了一倍,分配方式也更灵活;内核方面的改进说是提升了IPC每周期指令性能,SSE以及AVX指令也有所增强;整合GPU性能也有所提升,EU数从12个提升到16个,API支持也从DX10.1升级到了DX11。
更强图形性能与更为精确的功耗控制:Haswell
Haswell核心示意图
Haswell是Intel在2013年推出的全新微架构,该架构给人最深刻的印象就是把原来主板上的VRM模块整合到了CPU内部,FIVR调压模块的加入让主板的供电变得简单,并且可以对CPU内部的电压进行更为精确的控制,提高供电效率,实际上Haswell与Broadwell架构的产品是我见过电压最为稳定的Intel处理器。
指令集方面,Haswell增加了两个指令集,一个是针对多线程应用的TSX扩展指令,另一个是就是AVX指令的进阶版AVX2。还有一点就是从Haswell架构开始Intel的核显开始了模块化、可扩展的设计,就此走上了暴力堆砌核显规格的道路,最高级的核显拥有40个EU,还有大容量eDRAM作为L4缓存,可同时提升CPU与GPU性能。
其实在Haswell与Skylake之间还有个Broadwell,就是采用14nm工艺的Haswell处理器,不过Broadwell主要用在移动平台上,桌面级的Broadwell就两颗,而且国内没有正式上市所以没啥存在感,这里就不再做介绍了。
DDR4的时代到来:Skylake
Skylake核心示意图
Skylake可以说是自Sandy Bridge以来Intel最给力的一次升级了,CPU同时升级架构、工艺及核显,内存同时支持DDR3与DDR4,采用了更为先进的14nm工艺使得Skylake在频率提升、性能增强的同时功耗有了明显降低,而FIVR电压控制模块则被取消了,电压的控制也重新回到主板上。
Skylake处理器在超频上的改进可能让人眼前一亮,因为此前Intel对超频的限制颇多,全民超频的盛况早就不存在了,但Skylake处理器上,Intel虽然会继续限制倍频,但这次的BCLK外频限制没这么严了,外频能轻易超到125MHz以上,外频的解放更有助于极限超频玩家挑战更高记录。
核显方面,Skylake与Broadwell其实挺相似的,每组Subslice单元依旧是24个EU,但是整体规模变得越来越大了,Skylake最多可以扩展到3组Slice单元,也就是说最多会配备72个EU单元,因此Skylake也多出GT4这个级别的核显。
小修小补提升能耗比:Kaby Lake
Kaby Lake只是Skylake的优化版本,主要改善能耗比,然而这些在桌面版的处理器上表现并不明显,桌面版第七代处理器比较明显的区别只是频率高了。
Kaby Lake虽然都是使用14nm制程,不过Intel说他们对工艺进行了改良,Kaby Lake处理器上使用的新工艺使用了更高的鳍片与更宽的栅极间距,更高的鳍片意味着需要更小的驱动电流,这可减少漏电概率,而更宽的栅极间距这货会降低晶体管密度,这需要更高的电压但是可以降低生产难度,另外更宽的间距允许每个晶体管的产生的热有更多地方扩散,这有助降低内核温度并提升频率,这也是为什么Kaby Lake频率都比Skylake高但功耗则没什么变化的原因。
GPU方面Kaby Lake的核心与Skylake一样都是Gen 9,不过针对4K视频回放进行了改良,增加了H.265 Main.10、VP9 8/10-bit格式的硬件解码与编码,可大幅降低4K视频播放时的功耗,这对台式机来说可能不算什么,不过对移动设备来说降低功耗等同增加续航时间,这个是相当重要的。
这几年来Intel LGA 115X平台较有代表性的Core i7处理器规格一览(可点击放大)
近年来LGA 115X平台顶级主板芯片组规格一览
说真的主板芯片组的变化可能是给消费者更新换代的更大原因,如果说这些年来LGA 115X平台CPU给人的感觉总体差别不大的话,主板更新换代的差别就是相当大了,PCI-E总线从2.0变3.0,存储接口从SATA 3Gbps慢慢进化到SATA 6Gbps到现在最新的M.2/U.2接口,USB接口从2.0到3.0再到现在最新的3.1,这些都是能看得到且相当实在的变化,再加上主板厂商每次都会在主板上加新花样,可以说主板带来的变化更有让人更新换代的冲动。