心蝴蝶飞了!迅驰四代移动平台详解

best_dba 2007-06-20 10:55:33
前言

  关于英特尔最新一代移动计算技术的所有猜测在5月9号这一天都最终见了分晓,代号为Santa Rosa的迅驰处理器技术终于到来了。与之前的迅驰技术相比,Santa Rosa依然采用了平台组成方式——新的酷睿2双核处理器(Merom)、Intel PM/GM965芯片组、Intel Pro/Wireless 4965AGN无线模块都是其中的重要部件;与之前历代迅驰技术都不同的是,这次英特尔除了更换中文命名方式和产品标识之外,还增加了一位新成员,这个代号为Robson的家伙中文名称为英特尔迅盘,并作为选配部件提供给OEM厂商。

  新的中文名称——迅驰处理器技术

  有意思的是,在第一代迅驰技术发布时,英特尔极力扭转媒体和最终消费者在说法上的习惯,希望迅驰作为一个平台而非处理器技术留在人们的印象中。然而这种情况现在发生了改变,在Santa Rosa发布时,我们可以看到最新的官方说法为“英特尔迅驰处理器技术”。

  请注意,这里的处理器技术仅仅是说法上的改变,真正的迅驰依然是由处理器、芯片组和无线网络模块三个零部件组成的平台。对于名称上的变化,我们猜测这是无奈的做法:首先,作为衡量计算机系统性能最关键的因素之一,处理器给消费者留下的印象要远远大于芯片组和无线模块。其次,英特尔没有在迅驰上采用Pentium系列的命名方式,例如Centrino 1直到Centrino 4等等,而是统一采用中文的迅驰来规范Carmel、SONOMA、NAPA和Santa Rosa,如果经历四代之后在名称上依然不进行什么改变的话,恐怕消费者会越来越迷惑。

  新的标识——Centrino Duo和Centrino Pro

  事实上,中文命名方式并不会对Santa Rosa有太大影响,根据我们的经验,更多时候Centrino标志的曝光率要远远高于迅驰二字。不知道我们的读者是否还记得Centrino的来历——2003年3月12日是一个值得纪念的日子,这一天英特尔带来了首次专为笔记本电脑设计的平台技术,并第一次把Centrino展现在我们面前,按照他们的说法,Centrino是center(中心)与neutrino(微中子)两个名词的结合体,英特尔认为这个词汇听起来很有活力,而且会让人联想到“一种微小、快速,而且功能强大的设备。”

  如今,消费者已经习惯于查看笔记本电脑的掌托位置上是否会出现那心型的蝴蝶标志。但我们要提醒您注意的是,从Santa Rosa开始,这个我们已经熟悉得不能再熟悉的蝴蝶飞走了,取而代之的是显眼的紫色“Centrino”字样。
  

新旧迅驰logo比较,右为新logo

  另一个需要关注的事情在于,从Santa Rosa开始,英特尔将商用平台和消费平台也加以了区分。也许你会在相近配置的笔记本电脑中看到Centrino Duo和Centrino Pro的标志,这意味着尽管从表面看来两者的主要零部件相差不多,但两种标志直截了当地说明了这两款笔记本电脑的定位——具备Centrino Pro标志的产品面向商用,支持英特尔主动管理技术,其中的无线模块一定是Intel Pro/Wireless 4965AGN、Intel Pro/Wireless 4965AG之一,有线网络则是Intel 82566N千兆以太网,同时使用Santa Rosa的Merom处理器和Intel965系列芯片组;而想贴上Centrino Duo标志的要求就简单多了,只要选择Santa Rosa平台中的处理器和芯片组即可,无线网络模块甚至可沿用Intel Pro/Wireless 3945ABG。
  

Intel迅驰平台功能对比(点击放大)

  毋庸置疑的是,自从迅驰技术推出以来,笔记本电脑经历了翻天覆地的变化,而英特尔也再接再厉,在架构和制造工艺上都有所进步,推出一代又一代新的产品,令笔记本电脑的性能不断提升。那么,作为最新一代的产品,Santa Rosa会有什么样的特性呢?

  根据英特尔的宣传资料表明,Santa Rosa平台包含了大量新的特征和技术,例如新的GMA X3100显示芯片、802.11n无线网络、英特尔迅盘技术(Turbo Memory,Robson)、英特尔处理器动态加速技术(iDA)等。作为在笔记本领域一直投入极大精力的IT专业媒体,《个人电脑》在第一时间得到了来自英特尔的测试样机,以及众多OEM厂商送测的基于Santa Rosa平台的笔记本电脑。我们对这些产品进行了大量测试,意图让我们的读者能够尽量详尽地了解最新的迅驰技术和其实际表现。

  我们花费接近2个月的时间测试了这些新特性,同时也对先期发布的Core 2 Duo T7100/7300/7500/7700处理器逐一进行了测试,并与上一代处理器进行了对比,通过我们的测试可以看出,在最新的迅驰处理器技术上英特尔没有食言,诸多新特性都被测试项目一一验证——对其竞争对手来说,也许在低端移动计算市场上依然可以与这个芯片巨头一较高下,但在高端领域,两者的差距却越来越大。
...全文
402 16 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
16 条回复
切换为时间正序
请发表友善的回复…
发表回复
xz22503c 2009-12-04
  • 打赏
  • 举报
回复
程序没充分利用四核
dbd27 2009-12-01
  • 打赏
  • 举报
回复
不错啊!!学习了
converf 2008-09-30
  • 打赏
  • 举报
回复
搞技术的也不容易啊 顶下
wlcy1988 2008-09-30
  • 打赏
  • 举报
回复
很不错,值得顶!!
treetor 2008-09-30
  • 打赏
  • 举报
回复
看来楼主用啦很多的心思啊!!
formajia9 2008-09-28
  • 打赏
  • 举报
回复
关注中,期待中
majiajun_no_13 2008-09-26
  • 打赏
  • 举报
回复
留爪,学习
受教了,继续阿楼主
converf 2008-09-25
  • 打赏
  • 举报
回复
学习中,
majiajun_no_3 2008-09-25
  • 打赏
  • 举报
回复
受教了,
majiajun_no_3 2008-09-25
  • 打赏
  • 举报
回复
受教了,
ozar1155 2008-09-24
  • 打赏
  • 举报
回复
继续关注
lehedele 2008-09-24
  • 打赏
  • 举报
回复
受教了,继续阿楼主
mobilecoder 2007-06-22
  • 打赏
  • 举报
回复
帮顶一下,不错
best_dba 2007-06-20
  • 打赏
  • 举报
回复
1.4 高级数字媒体增强

  Advanced Digital Media Boost(高级数字媒体增强)是酷睿2双核处理器中一个新颖的概念,它所指的其实是酷睿2双核处理器中获大幅度增强的SSE执行单元。

  简单点说,就是酷睿2双核处理器的SSE执行单元首度提供完整的128位支持,每个单元都可以在一个时钟周期内执行一个128位SSE指令,而Yonah核心的酷睿双核处理器仅实现64位支持,要执行一条128位SSE指令的话需要花费两个时钟周期;Pentium 4处理器虽然也拥有128位执行单元,但它仅仅只有一组,实际处理能力相当于酷睿2双核处理器的二分之一。

  在128位SSE执行单元的共同作用下,酷睿微架构可以在一个时钟周期内同时执行128位乘法、128位加法、128位数据载入以及128位数据回存,或者是可以同时执行4个32位单精度浮点乘法和4个32位单精度浮点加法。

  显而易见,SSE性能增强的最大受益者自然是多媒体应用,这也是该项改良被包装成“Advanced Digital Media Boost”的主要理由。

  1.5 高级智能高速缓存

  对双核处理器来说,采用何种缓存设计关系到两枚核心协作的紧密程度。Pentium D采用独立缓存设计,而且缓存之间缺乏直接沟通的渠道,导致两颗核心无法进行紧密的协作;而当两颗核心同时执行一个任务时,为了保持指令执行的步调一致,两个核心的缓存数据必须保持一致性,但Pentium D的二级缓存彼此隔绝、缓存数据同步效率低下——倘若CPU 0的二级缓存需要读取CPU 1的二级缓存,只能经由前端总线、芯片组再到内存,从内存中获取数据进行同步更新,这个繁琐的过程不仅消耗了大量的时钟周期,且占用大量的前端总线带宽资源。共享缓存设计被认为是解决上述问题的最佳办法。酷睿2双核处理器便采用一项名为“高级智能高速缓存(Advanced Smart Cache)”的共享缓存技术、让两枚处理核心共同分享4MB或2MB容量的二级缓存,为了解决缓存资源分配的问题,酷睿2双核处理器引入了一项名为 “Shared Bus Router(共享总线路由)”的控制逻辑,在双核协作处理单个任务时,CPU内核总是先访问分配给自己的缓存区域,如果发现没有查找到所需的数据就会通过Shared Bus Router访问分配给另一个CPU内核的缓存资源,整个过程的读取延迟相当于访问三级缓存、当然它也不会挤占任何前端总线的带宽资源。此外,Smart Cache技术还增加了L2 & DCU Data Pre-fetchers及Deeper Write output两个缓冲存储器,有效提升了Cache的命中率,这也对提高CPU执行效率起到积极的影响。

  除了具有出色的读取效率外,高度弹性也是Advanced Smart Cache架构主要优点之一。当遇到两个核心工作量不等时,例如CPU 0负载高于CPU 1,Advanced Smart Cache就可以给CPU 0分配更多的缓存资源,保证系统效能的最大化——独立缓存架构就难以做到这一点,CPU只能访问自己的缓存资源无法借用另一个CPU的缓存,在遭遇不均等负载时就会出现某个CPU缓存不够用、不得不访问系统内存,而另一个CPU的缓存资源却大量闲置不用的情况。Advanced Smart Cache技术还意味着更高的容量利用率——在节能模式下,Merom处理器都支持单核心模式运行,如果沿用独立缓存设计,那么此时CPU也只能用到 1/2的缓存资源;而共享缓存设计就没有这个问题,不管在何种模式下,CPU的全部二级缓存总是处于有效利用状态,避免系统效能出现太大幅度的下滑。

  超低能耗是Advanced Smart Cache技术又一个突出的优点,这项特性实际上始于Banias核心 Pentium M,Banias的1MB二级缓存被划分为32 x 32KB的区域,任意时刻只有一个片区处于激活状态,其余区域则暂停不消耗能源,这样二级缓存的能耗和发热量就被大大降低——由于二级缓存的晶体管数目可占据CPU晶体管总量的一半以上,功耗比重也非常可观,Banias使用低能耗缓存设计后,将芯片的TDP功耗控制在24瓦的水平,表现非常出色。之后的Dothan和 Yonah核心都将二级缓存提高到2MB,缓存区域划分变为64 x 32KB,实际能耗并未有多少提升。而酷睿微架构支持2MB和4MB二级缓存,但它们同样继承了这项设计,避免CPU因缓存容量提升而出现功耗快速上扬的情况——酷睿2双核处理器之所以能在配备4MB缓存的条件下还保持低功耗和低发热特性,除了酷睿微架构自身的优势外,高级智能高速缓存技术也功不可没。
best_dba 2007-06-20
  • 打赏
  • 举报
回复
1.2 智能内存访问技术

  酷睿2双核处理器并没有整合内存控制器,内存访问延迟仍然较长,为了克服此项缺憾,英特尔发展出一项名为“Smart Memory Access”的智能内存访问技术,它包括“内存数据相依性预测(Memory Disambiguation)”和强化的预取机制,两者共同的目标都是对CPU的内存访问动作进行优化、提升其访存性能。

  内存数据相依性预测技术可有效提高CPU读取数据的效率。在过去,如果遇到写入、读取相连的指令序列,因两者可能操作相同的内存地址,CPU 就必须首先执行写入指令,完毕之后再执行读取指令,倘若读取、写入指令同时执行,CPU就有可能读取到写入前的无效数据,从而导致后续运行出错。这个问题对多核心和多处理器系统来说非常尖锐,因为多个处理核心操作相同内存地址的情况十分常见,遇到这种情况,所有处理器都必须停下来按顺序依次进行,处理器数量越多,等待的时间就越长,导致性能不增反降!酷睿2双核处理器所引入的内存数据相依性预测功能很好地解决了这一难题:CPU在执行写入指令时,会预测后续的读取指令是否操作相同的内存地址,如果地址不同,就可以并行执行写入、读取动作,无需等到写入指令完成,因此这项技术可以大幅度改善乱序指令的执行效率。

  酷睿2双核处理器降低内存延迟的另一项有力措施是强化预取机制。预取包括指令预取和数据预取,指令预取机能与CPU执行指令的延迟有关,而与内存延迟相关的则是数据预取机制——酷睿2双核处理器的每个核心都拥有两组数据预取逻辑,二级缓存控制器也内建两组,并可将预取的数据动态分配到不同核心,这样,程序数据可以被尽量放在缓存单元内、减少CPU访问内存的次数,达到提升效能的目的。

  1.3 智能型电源管理

  在酷睿2双核处理器中,英特尔通过改变核心架构、采用更先进的制造技术以及引入全方位的节能特性来实现低功耗。逻辑设计方面,便是我们熟知的将流水线长度缩短到14级,CPU保持低频率运作,同时采用低功耗的二级缓存单元。制造技术方面,酷睿2双核处理器使用65纳米应变硅和Low-K技术制造,并较好地缓解了漏电流问题,保证芯片的低能耗运作。而与这两者同等重要的便是酷睿2双核处理器无所不在的节能特性,这些特性可以归结为以下几个小点:

  ● 动态激活/关闭功能单元:酷睿2双核处理器的电源管理机制由在Pentium M与Yonah基础上改良而来,但酷睿2双核处理器的电源管理机制更为强大,CPU内各个逻辑单元并非一直保持在激活状态下,而是根据预测机制来判断需要激活的功能单元,其他不相干的逻辑则处于关闭状态,彻底消除无谓的能源消耗。

  ● 分离式前端总线(Split Buses):酷睿2双核处理器与酷睿双核处理器相似,采用64位宽度、以并行方式运作的前端总线。虽然在多数时候传送的数据都没有这么长,但酷睿双核处理器在传输数据时,所有传输线路都消耗相同的电力、能源浪费现象比较严重。而酷睿2双核处理器引入了Split Bus设计来解决这一问题:在多数时候,前端总线只启动32位、另外32位暂时关闭,只有遇到特殊情况时才将传输线路全部启动,这样就有效降低了前端总线传输的能源消耗。

  ● 运行温度控制:英特尔一向重视处理器的安全性,热量侦测、温度控制以及过热保护功能非常完善,在酷睿2双核处理器中,英特尔又对此作了进一步的增强——其内部多个容易发热的位置都放置了数字热量传感器(Digital Thermal Sensor),并借助专门的控制电路来监控处理器的发热量和运作模式;此外,酷睿微架构还提供PSI-2(Power Status Indicator 2)功能,实时通知系统现在的耗电状況,以作为动态调整电压的依据。

  ● 增强型SpeedStep(Enhanced Intel SpeedStep,简称EIST):作为英特尔移动处理器的经典技术,增强型SpeedStep依然出现在新的Merom处理器中,除了可实现电压/频率的动态调节外,该技术还允许Merom以单核模式运行,将能耗降低到最低限度。尽管自身的运行功耗已经很低,酷睿2双核处理器仍然支持EIST技术实现进一步节约能源。
best_dba 2007-06-20
  • 打赏
  • 举报
回复
1.新一代酷睿2双核处理器

  尽管代号(Merom)与上一代Napa refresh平台相同,但新的酷睿2双核处理器还是具备诸多新特性,并且这恐怕也是Santa Rosa平台中改变最大的部件了。需要说明的是,目前发布的Merom处理器中,型号为Core 2 Duo T7100的处理器可以算是一个另类,它不仅是唯一一款主频低于2GHz的标准电压处理器,也是唯一一款二级缓存为2MB的产品。除此之外,已经发布的 T7300/T500/T7700全部具备4MB容量的二级缓存。
  

Intel移动处理器规格对比

  新的Merom处理器采用了Socket P接口,而之前的产品则是Socket M接口,这就意味着我们无法将Santa Rosa中的任何一款处理器用于之前的平台,反之亦然。对普通消费者来讲,目前英特尔的处理器型号以及命名方式足以令他们感到眼花缭乱,因此我们列出了目前还在销售的一些处理器的规格表,我们并不希望读者朋友们能够牢记规格表中的每一款处理器的相关参数,而是希望当您在选购笔记本电脑的产品之前可以随时翻阅杂志查看这些数据——把它当作一个备忘录来使用远远要比记住它们轻松且实际得多。
  

Socket M和Socket P接口对比

  新的Merom处理器采用了800MHz外频,由于它们全部基于酷睿微架构,因此我们有必要再次简要回顾一下酷睿微架构及酷睿2双核处理器所具备的诸多先进特性:

  1.1 宽位动态执行

  酷睿微架构通过提高静态指令并行能力、优化动态指令两种措施实现高效运作,这两种方案在CPU硬件上有不同的实现——针对静态指令,处理器以提高指令并行执行能力应对,而针对动态指令,处理器引入了一项名为“宏操作融合(Macro-Op Fusion)”的指令优化技术,再加上从Pentium M继承而来的“微操作融合(Micro-Op Fusion)”技术,动态指令得以最大程度的精简化,最终让酷睿2双核处理器获得卓越的每瓦性能。

  大家都知道,增强指令并行执行能力是提高CPU效率最有效的办法之一!而在CPU内部,一个指令的执行过程必须经过解码器解码后交给相应的运算单元加以执行,解码操作的实质就是将长度不一的x86指令分解为多个固定长度的微指令(类似RISC指令),以提高后续处理的效率。因此,要让CPU拥有尽可能高的并行处理能力,首先就要增加指令解码器的数量——每个解码器对应一个指令,解码器数量越多,并行执行能力就越强!但这并不是说解码器数量可以无限制增加,由于x86指令系统远比RISC指令系统来得复杂,指令长度、格式与定址模式都非常紊乱,受此制约处理器厂商一直都无法在自己的产品中设计三个以上的解码器,包括P6/Pentium M、Netburst、K7/K8架构产品都是采用三个解码器设计,也就是每个时钟周期最多只能对三条指令进行解码。

  而在解码器设计方面,一直都有传统的“简单-复杂”专用解码器以及通用解码器两类设计方案,专用解码器要么只能对静态指令进行解码、要么只能对动态指令解码,具有较高的效率;通用解码器虽然能够同时处理两类指令,但它效率较差——英特尔的P6/Pentium M架构、AMD K7/K8架构都属于“简单-复杂”专用体系,三个解码器由一个复杂指令解码器(complex decoder)和两个简单指令解码器(simple decoder)构成的“4-1-1”结构;其中,复杂指令解码器可对包含2~4个微指令的复杂指令作解码处理,但若遇到更加复杂的指令,解码器就会呼叫微码循序器(Microcode Sequencer)、将复杂指令分解为多个微指令系列分别执行。到了Netburst架构出现,情况就发生了变化,英特尔改用通用解码器方案,每个解码器都能处理简单指令和复杂指令,当遇到动态指令较多的应用时,NetBurst架构具有较高的效率;可一旦遭遇简单指令较多的应用,Netburst的通用解码器效率平平,加之流水线过长,一旦分支预测代价巨大,就会使得Netburst架构整体性能不高。而在Netburst之后露面的Banias Pentium M架构则回复到P6架构的4-1-1经典方案,将复杂指令和简单指令重新分开,只是通过多方位改良来提高处理器性能!

  酷睿2双核处理器同样采用专用解码器设计,即采用简单解码器和复杂解码器相互独立的方案,但不同之处在于它将简单解码器的数量提高到三个,复杂解码器仍为一个——由于后者最多可处理由四个微指令组成的动态指令,因此酷睿2双核处理器的解码器就变为4-1-1-1结构。显然,英特尔以某种机制成功克服了x86指令并行解码限制的困扰。

568

社区成员

发帖
与我相关
我的任务
社区描述
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
社区管理员
  • 英特尔技术社区
  • shere_lin
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧