当前位置：首页 > 行业资讯> 英特尔为数据中心带来更强大的 AI 训练和推理

英特尔为数据中心带来更强大的 AI 训练和推理

发布时间：2022年05月12日 10:17:49 来源: A5互联

英特尔周二推出了用于训练和推理的最新一代深度学习处理器 Habana Gaudi2 和 Habana Greco，让 AI 对其数据中心客户来说更易于访问和更有价值。在其英特尔愿景活动中，这家芯片制造商还分享了有关其 IPU 和 GPU 产品组合的详细信息，这些产品都是针对商业客户的。

“人工智能正在驱动数据中心，”英特尔数据中心团队 Habana Labs 的首席运营官 Eitan Medina 早些时候对记者表示。“这是最重要的应用，也是增长最快的。但不同的客户针对不同的应用使用不同的混合物。”

不同的用例解释了英特尔对多种数据中心芯片的投资。Habana 处理器专为需要深度学习计算的客户而设计。例如，新的 Gaudi2 处理器可以改进用于自动驾驶汽车、医学成像和制造缺陷检测的应用的视觉建模。英特尔在 2019 年以约 20 亿美元的价格收购了可编程芯片制造商Habana Labs 。

第二代 Gaudi2 和 Greco 芯片均采用 7 纳米技术实现，比第一代的 16 纳米技术有所改进。它们是在 Habana 的高效架构上制造的。

英特尔周二表示，对于 ResNet-50 计算机视觉模型和 BERT 自然语言处理模型，Gaudi2 的训练吞吐量是英伟达 A100-80GB GPU 的两倍。

“与在相同工艺节点和大致相同裸片尺寸中实施的 A100 GPU 相比，Gaudi2 提供了清晰的领导力培训性能，正如在关键工作负载上的苹果对苹果比较所证明的那样，”Medina 在一份声明中说。“这种深度学习加速架构从根本上更高效，并有强大的路线图支持。”

关于Gaudi2的更多信息：

与第一代 Gaudi 相比，它在 AWS 云中使用 Amazon EC2 DL1 实例和在本地使用 Supermicro X12 Gaudi 培训服务器提供高达 40% 的性价比

引入了用于压缩媒体和卸载主机子系统的集成媒体处理引擎

Gaudi2 以 2.45TB/秒的带宽将 HBM2E 的封装内存容量从 32GB 提高到 96GB

在片上集成 24 个 100GbE RoCE RDMA NIC，用于使用标准以太网进行纵向扩展和横向扩展

Habana 客户现在可以使用 Gaudi2 处理器。Habana 与 Supermicro 合作，今年将 Supermicro Gaudi2 Training Server 推向市场。

同时，第二代 Greco 推理芯片将从今年下半年开始向部分客户提供。

有关第二代 Greco 的更多信息：

包括卡上的增强内存，基本上将带宽提高了 5 倍，并将片上内存从 50MB 推至 120MB

添加媒体解码和处理

为计算效率提供更小的外形尺寸：从双插槽 FHFL 到单插槽

“Gaudi2 可以帮助英特尔客户以速度和效率训练日益庞大和复杂的深度学习工作负载，我们期待着 Greco 将带来的推理效率，”英特尔执行副总裁 Sandra Rivera 在一份声明中表示。

英特尔周二还公布了其基础设施处理单元 (IPU) 产品组合的扩展路线图。英特尔最初为云巨头——谷歌和 Facebook 等超大规模企业——构建 IPU，但现在它正在扩大访问范围。

英特尔明年将推出两款 IPU：Mount Evans，英特尔的第一个 ASIC IPU，以及 Oak Springs Canyon，这是英特尔的第二代 FPGA IPU，将向谷歌和其他服务提供商发货。

英特尔计划在 2023 年和 2024 年推出其第三代 400GB IPU——代号为摩根山和温泉峡谷。到 2025 年和 2026 年，英特尔预计将向客户和合作伙伴交付 800GB 的 IPU。

英特尔周二还分享了其代号为北极之声的数据中心 GPU 的详细信息。专为云端媒体转码、视觉图形和推理而设计，Arctic Sound-M (ATS-M) 是业界首款配备 AV1 硬件编码器的独立 GPU。它提供以每秒 150 万亿次操作 (TOPS) 为目标的性能。ATS-M 将提供两种外形尺寸和来自合作伙伴的超过 15 种系统设计，包括戴尔、超微、浪潮和 H3C，它将在今年第三季度推出。