英特尔在今年Computex计算机展发布Xeon 6处理器,由搭载效率核心(E-core)版本的Xeon 6处理器先打头阵,本周英特尔再补齐Xeon 6处理器产品线,推出搭载性能核心(P-core)版本,提高核心数及内存带宽,最高至128个核心。

Xeon 6为服务器专用处理器,是英特尔首款采用Intel 3节点设计的产品,其中分为搭载E-core效率核心版本(代号Sierra Forest),以及搭载P-core性能核心版本(代号Granite Rapids)。今年6月,英特尔先推出E-core版Xeon 6处理器,锁定超多核心需求,最高拥有144个E-Core核心,主要锁定高密度、高能源效率数据中心使用需求,适用于云原生、CDN、微服务架构等应用。

至于新推出的P-core版本Xeon 6处理器,锁定密集型工作负载需求,AI及高性能计算市场,不仅增加核心数,并且将AI加速功能嵌入到每个核心,内存带宽也加倍。英特尔称该处理器适用于边缘、数据中心到云计算的AI运算需求,强调能在不需独立加速器之下,执行数十亿参数的AI模型。

根据官网的消息,Xeon 6900P系列搭载的P-core为超线程核心,针对AI、HPC、数据等工作负载需求,采用矩阵引擎,最高拥有128个核心,最多504MB的缓存内存;而E-core版本的Xeon 6700E系列,使用单线程提高核心密度,并且省略矩阵引擎,单处理器最高拥有144个核心,英特尔计划今年底再推出更高核心数,将单插槽核心数推升至288个核心。

除了P-core版Xeon 6的推出,英特尔也更新旗下的AI加速器Gaudi 3,强调为大规模生成式AI需求设计的Gaudi 3,拥有64个张量处理器核心、8个矩阵乘法引擎,内置128GB HBM2e内存,支持24个200Gb的网络端口,使新的Gaudi 3提升20%的吞吐量,英特尔强调和Nvidia的H100相比,在Llama 2 70B推论时,同样成本下提供2倍的性能。

英特尔指出,Gaudi 3支持PyTorch框架、Hugging Face Transformer、Diffuser模型。目前英特尔已和合作伙伴联手,针对生成式AI优化的方案,例如戴尔合作规划设计RAG方案。