Intel详细介绍了下一代处理器架构

龙人计算机SMT事业部整理:Intel将于42-3日在我国上海举行2008年第一场信息技术峰会(IDF),而在今天召开的会前简报中,Intel详细介绍了下一代处理器架构Nehalem、独立图形芯片Larrabee、六核心Xeon处理器Dunnington、四核心Itanium处理器Tukwila等等。

Intel架构发展的两个方向:高性能千万亿次运算Peta FLOPs、低功耗便携型Milli Watts

首先登场的是代号Tukwila的四核心Itanium,首次集成20亿个晶体管,30MB二级缓存,和Nehalem一样也支持QPI总线技术和多线程技术,并集成内存控制器。预计年底出货,相关服务器系统明年上市。

接下来是代号Dunnington的六核心Xeon,基于45nm Penryn架构,集成约19亿个晶体管,拥有16MB三级缓存。特别值得一提的是,DunningtonIntel印度班加罗尔设计团队的第一款实际出货的作品。

当然普通消费者最关心的还是桌面上的Nehalem。除了此前已知的技术资料,Intel还表示Nehalem采用了模块化架构设计,因此可以自由选择组成双、四、六、八核心型号,并在其中选择加入图形核心、内存控制器、缓存、QPI总线等模块。

Intel称,Nehalem可同时处理128个微指令(micro-op),比Penryn96个多出三分之一,再加上每个核心都能同时处理两个线程,因而可以实现更强大的指令级并行(ILP)

Nehalem的其他架构改进还有:更快的缓存访问速度、更强的同步原语性能、每核心新增第二级分支预测、重命名堆栈返回缓存。

不过Nehalem的解码和前端设计没有显著变化,和Core架构一样还是4-issue设计。预计再次变革要等到32nm Sandy Bridge时代。

Nehalem还特别支持双路同步多线程(SMT)技术,和Pentium 4的超线程(HT)技术类似,但由于Nehalem的流水线比NetBurst更短、核心数据获取能力更强,因此Nehalem的多线程性能将得到明显提升。

缓存架构方面,Nehalem相比Penryn可以说是发生了翻天覆地的变化。除了32KB一级指令缓存和32KB一级数据缓存,二级缓存和三级缓存都是新的:每个核心都独自拥有256KB二级缓存,虽然容量比Penryn小,但延迟更低;共享缓存则变成了8MB三级缓存。

这种架构设计与AMD K10 Phenom类似,但其实大不一样:AMD采用了非独占(Exclusive)设计,Intel则是独占(Inclusive)设计,也就是每级缓存都保留来自低级缓存的数据拷贝。

此外Intel还加入了第二级TLB,与第二级分支预测类似。如果第一级TLB里找不到物理、虚拟地址映射,就可以在第二级TLB里寻找,而不必前往缓存,从而保持高性能和低延迟。

接下来看看Nehalem平台设计。桌面方面将集成DDR3内存控制器,最高DDR3-1333,每核心三通道,同时还有更大的带宽和更低的内存延迟。

服务器方面重点是QPI点对点总线设计,每路两个链接,每条链接最高带宽25.6Gb/s

此外Intel还提到了2009-2010年的32nm WestmereSandy Bridge,其中前者是NehalemSMT工艺改进版,后者则是又一轮新架构。

细节方面Intel一直没有披露多少资料,不过明确表示Westmere会引入一种新的矢量指令高级矢量扩展(AVX),但256-bit矢量操作支持还是要等到Sandy Bridge

Intel会在IDF上详细介绍AVX指令技术。

最后一个话题是LarrabeeIntel的高度并行多核心微处理器架构,适合视觉运算和主流图形显示。

Larrabee的每个核心都支持新的矢量指令,目前Intel正与游戏开发商就此展开合作,不过Intel没有公开细节。Larrabee将支持OpenGLDirectX API,但如果游戏开发人员能直奔ISA,无疑会更加精彩。

Larrabee将在2009-2010年间以独立显卡的方式出现,与AMDNVIDIA展开多方面竞争。

Intel还在现场运行了基于NehalemDunnington处理器的系统,不过都只有Demo演示,不许进行实际测试,也没有披露具体规格。

 

发表评论 阅读全文(268) | 回复(0)
评论

标题
姓名  
主页
加粗斜体下划线删除线上标下标删除格式
左对齐居中右对齐两端对齐编号项目符号增加缩进减少缩进创建链接断开链接插入图片
剪切复制粘贴删除撤消重做打印
前景色背景色
插入时间插入日期插入水平尺
预览选择所有清除word格式
qq表情msn表情Yahoo表情
上传图片上传压缩包上传文档上传flash
验证码: