处理器大厂英特尔指出,AI颠覆各产业,企业对兼顾成本效益和快速开发部署基础设施的需求愈趋增长。应对需求攀升,推出搭载性能核心(P-core)的Xeon 6和Gaudi 3 AI加速器,强化致力提供每瓦最佳性能且降低总持有成本(TCO)的强大AI系统承诺。

英特尔Intel Xeon 6搭载性能核心,专为处理运算密集型工作设计,兼顾优异效率。相较上代处理器,Xeon 6性能提升两倍,不仅核心数增加、内存带宽加倍,更将AI加速功能嵌入每核心,专为满足边缘到数据中心和云计算环境的AI性能需求。

Gaudi 3 AI加速器特别为大规模生成式AI优化设计。Gaudi 3有64个张量处理器核心(TPC)与八个矩阵乘法引擎(MME),加速深度神经网络运算。还有训练与推论用128GB HBM2e内存,以及可扩展网络的24个200 Gb以太网络连接端口。

Gaudi 3也有与PyTorch框架、先进Hugging Face Transformer模型和diffuser模型无缝兼容性。英特尔近期宣布与IBM合作,将Gaudi 3 AI加速器部署至IBM Cloud,客户使用AI与扩展AI规模时,能同时强化性能与降低总持有成本(TCO)。

英特尔AI技术还有多种考量,如灵活弹性选项、具竞争力价格性能比,以及可用AI技术等。英特尔x86架构与开放生态系,支持企业构建具优化总持有成本及每瓦性能的高价值AI系统。市场高达73% GPU加速服务器为Intel Xeon系列处理器的服务器处理器(host CPU)。

英特尔执行副总裁暨数据中心与AI解决方案总经理Justin Hotard指出,AI需求带动数据中心大规模转型,因此软硬件和开发工具需要更多选择。英特尔推出性能核心的Xeon 6和Gaudi 3 AI加速器,促进开放生态系发展,使客户以更佳性能、效率和安全性,满足所有工作。

英特尔与OEM伙伴戴尔科技、美超微,开发共同设计系统,戴尔科技与英特尔共同设计适用Gaudi 3和Xeon 6且以检索增强生成(RAG)为基础的解决方案。生成式AI(Gen AI)解决方案由原型设计推进至量产就绪时,会有即时监控(real-time monitoring)、错误处理(error handling)、记录日志文件(logging)、安全性和可扩展性等挑战。

故英特尔与OEM厂商伙伴,共同处理这些挑战,推出量产就绪的RAG解决方案,创建于Open Platform For Enterprise AI(OPEA)平台上,基于OPEA的微服务架构集成至可扩展的RAG系统,并对Xeon和Gaudi AI系统优化,目的为协助客户轻松集成Kubernetes、Red Hat OpenShift AI和Red Hat Enterprise Linux AI的应用程序。

Intel Tiber产品组合提供企业解决方案,解决横跨AI、云计算与边缘环境的各种挑战,包括访问、成本、复杂性、安全性、效率和可扩展性。Intel Tiber Developer Cloud提供英特尔Xeon 6预览系统,可供技术评估与测试。特定客户可抢先体验英特尔Gaudi 3,以实际验证AI模型。Gaudi 3集群下季度推出,可大规模量产部署。

(首图来源:英特尔)