以太网在要求苛刻的人工智能计算环境中占据一席之地



以太网在要求苛刻的人工智能计算环境中占据一席之地

人工智能(AI)在各种类型和规模的企业中的广泛采用需要企业数据中心通常不具备的高性能计算和基础设施。在计算方面,许多人开始转向GPU和其他工作负载加速器,例如基础设施处理单元(IPU)、数据处理单元(DPU)和Compute ExpressLink(CLX)技术。在基础设施方面,虽然有些人正在考虑或使用InfiniBand,但许多人仍坚持使用以太网。

最新的IDC全球以太网交换机季度跟踪报告证实了这一点。IDC发现,截至目前最新季度报告,2023年第三季度数据中心以太网交换机销量同比增长7.2%。

企业的立场如何:以太网还是InfiniBand?

值得注意的是,InfiniBand在去年也大幅增长。但许多人仍然对在企业中使用它犹豫不决。为什么?InfiniBand与以太网的权衡非常明显。

InfiniBand在满足国家实验室和学术超级计算机中心苛刻的工作负载需求方面拥有悠久的历史。从好的方面来说,与传统以太网相比,InfiniBand可提供更高的吞吐量、更低的延迟、可扩展性、服务质量等特性。

也许市场上最大的变化使InfiniBand成为企业更可行的选择,这就是NVIDIA在该领域所做的努力。2019年,该公司宣布将收购InfiniBand产品开发先驱Mellanox。NVIDIA现在提供InfiniBand解决方案,包括交换机、DPU、网络接口卡等。

即使有这样一个主要供应商在人工智能领域提供解决方案,许多企业仍然希望使用以太网。许多人发现InfiniBand成本更高,带来了以太网所没有的复杂性,通常与现有基础设施存在互操作性问题,并且仅由有限数量的供应商提供。在许多情况下,企业没有人员和专业知识来使用和管理该技术。

以太网不断发展以满足人工智能的需求

训练和运行人工智能模型正在推动数据中心联网需求。供应商社区知道许多企业用户更喜欢使用以太网,因此正在探索针对此类环境及其中运行的工作负载改进或优化以太网的方法。

最近成立的超级以太网联盟就是一个例子。这项工作是由Linux基金会主办的联合开发基金会项目。该公司的创始成员包括AMD、Arista、Broadcom、Cisco、Eviden(Atos公司)、HPE、Intel、Meta和Microsoft。

正如去年8月宣布该公司时所报道的那样,该公司致力于为人工智能和高性能计算(HPC)工作负载构建一个完整的基于以太网的通信堆栈架构。

另一项努力包括思科的SiliconOneG200和G202ASIC的工作,它们是支持AI/ML工作负载的新型网络芯片。此外,Broadcom和NVIDIA正在致力于为AI工作负载开发性能更高的以太网解决方案。

上一篇:国外科技公司的裁员让恢复快速增长的希望变得渺茫
下一篇:引领2024年:塑造科技格局的变革趋势