推开新时代PC的大门,英特尔全新“AI处理器”解析

2023-12-16 12:07
摘要:此前在今年9月,我们三易生活曾经结合当时最新的架构资料,以及所拿到的一些独家内部数据,率先为大家“解析”了英特尔的最新一代移动处理器架构。当然,现在大家都已经知道,当时我们所“解析”的对象就是刚刚发布..

此前在今年9月,我们三易生活曾经结合当时最新的架构资料,以及所拿到的一些独家内部数据,率先为大家“解析”了英特尔最新一代移动处理器架构。

当然,现在大家都已经知道,当时我们所“解析”的对象就是刚刚发布的第一代酷睿Ultra处理器的某个ES版本。

不过平心而论,当时我们拿到的资料毕竟还比较早期,所以它尽管已经讲得十分详细,但距离最终上市的版本还是有着一些差距,这也就是为什么我们非常要关注2023年12月15日英特尔这场新品发布会的原因。以结果来说,这次活动也确实没有令我们失望。

更大、更强,第五代可扩展至强“大杀器”登场

不得不说,英特尔此次新品发布会与以往相比最大的一点不同,就在于他们几乎是首次将面向企业的云端服务器CPU新品,和面向消费者的端侧计算设备CPU新品放到了一起。

首先亮相的,是第五代至强可扩展处理器。根据相关技术资料显示,与第四代至强可扩展处理器相比,代号“Emerald Rapide-SP”的新CPU依然沿用了Intel7制程,但对架构进行了大幅度的重新设计。

此次亮相的第五代至强可扩展处理器“完整规格”,拥有64颗、而不再是上代的60颗内核,并且这些核心现在被分为2个MCM模块、而不再是上代的4个。这也就意味着新架构的每一个CPU模块,都具备了相当于上代2倍还多的内核数量。

在此基础上,第五代至强可扩展处理器的基本架构也从Golden Cove更新到了Raptor Cove,这就意味着它与大家熟悉的13代、14代酷睿一样,对缓存和内存子系统进行了大幅度的增强。比如将新款的Xeon8592+与前代Xeon8490H对比就会发现,它的L3Cache从112.5MB一口气增加到了320MB。同时与前代的DDR5-4800相比,八通道DDR5-5600起步的内存频率,也代表其内存带宽得到了显著的增强。

当然,以上的这些架构、性能改进,主要服务的都是诸如京东、阿里、百度这样的云服务厂商。也就是说,它的作用在于加速如今AI大模型在云端的迭代和应用效率。但除此之外,大家都知道英特尔还有一个相对“民用”、面向发烧友的产品线Xeon W,所以第五代可扩展至强的架构,实际上也相当于变相预告了下一代Xeon W的诸多信息。

更多核心、更强核显、还有NPU,酷睿Ultra来了

接下来就是此次发布会的重头戏,全新的英特尔酷睿Ultra处理器了。

首先在架构上,第一代酷睿Ultra是英特尔旗下首款采用了多模块、多制程混合封装设计的处理器。它的每一颗核心拥有四个模块,分别是采用Intel4制程的CPU模块、采用台积电5nm制程的GPU模块,以及采用台积电6nm制程的SoC模块、和同样是基于台积电6nm制程的IO模块。

这样的设计有什么好处呢?一方面它可以让处理器集成更多的功能组件。比如以这一代定位最高的酷睿i9-185H为例,它的CPU模块集成了6P+8E、总共14颗CPU核心,同时在SoC模块里还有2颗额外的E核,可以在运行极低负载时完全关闭CPU模块,从而达到更省电的目的。

又比如说,酷睿Ultra的ARC GPU模块现在拥有更“全”的Xe架构。它最多拥有128个执行单元(而非前代的96个),运行频率可以高达2250MHz,并拥有64个纹理单元和32个光栅单元,此外还支持硬件光追和XeSS硬件AI超分抗锯齿。在这样的配置下,新的核显FP32性能可以高达4.608TFlops,相当于前代的整整两倍。

除此之外,酷睿Ultra也成为了英特尔首款集成NPU的移动处理器方案,根据相关技术资料显示,它的NPU算力可达10TOPs。与此同时,其还集成了雷电4控制器。

除了架构、设计上的大幅改进,酷睿Ultra此次还有一个非常值得关注的亮点,那就是它标压版本的默认TDP仅28-45W,最大TDP也不过115W。要知道自11代开始,标压的移动版酷睿已经很久没有过如此低的官方TDP参数了,诸如14900HX这样的高端标压移动CPU,更是有着157W的官方最高TDP设定。从目前各个渠道曝光的相关信息来看,超高的能效比很可能会是第一代酷睿Ultra在实际使用中的突出亮点。

如何让“AI PC”真正实用,英特尔确实带了个好头

如果大家有关注最近的相关信息想必知道,其实英特尔的竞争对手,比如高通、超微,在此前就发布了具备独立NPU的移动CPU产品线。相比之下,英特尔的酷睿Ultra系列反而算是来得比较晚的了。

但这并不意味着英特尔在“AI PC”的技术路线上,起步得就比竞争对手晚。实际上,早在2019年英特尔就已经在当时的酷睿X系列处理器(Cascade Lake)里,首次加入了用于加速深度学习计算的DL Boost指令集。

后续到了10代、11代酷睿移动版上,DL Boost和AVX-512指令集进一步被普及到更多的普及型产品上,从而使得当时的许多笔记本电脑产品就具备了类似摄像头居中、麦克风降噪、视频超分这类AI体验。

后续随着英特尔方面将Xe架构引入酷睿处理器的核显,这些核显实际上也具备了AI加速能力。比如在一些12代、13代酷睿的笔记本、甚至台式PC上,就都能够看到基于核显算力去实现的AI语音助手、AI背景虚化等功能。

正因如此,在第一代酷睿Ultra处理器里,虽然表面上看,它的“AI单元”好像就是一个NPU。但实际上,英特尔早就搞定了让CPU、GPU、NPU根据不同代码承担不同AI任务、有时甚至可以协同计算的异构加速体系,并且他们将这种技术称之为“XPU”。

而且更为重要的是,在今天的发布会上可以看到,英特尔已经拉来了大量的国内软件厂商,演示了他们的产品在酷睿Ultra上通过AI加速运行的效果。据英特尔方面的说法,即便在这个产品才刚刚发布的时间点上,酷睿Ultra就已经得到了超过100款以上软件的官方适配,可以发挥出AI的加速效果来。

不得不说,比起单纯往CPU里塞硬件AI加速单元,英特尔这套独特的异构处理设计,以及他们为推动“AI PC”普及而进行的大量适配,可能才是酷睿Ultra与竞争对手相比最为明显的优势所在。

更新于:2023-12-16 12:07