数据处理单元 (DPU) 是一种专用处理器,旨在卸载和加速以数据为中心的任务,释放中央处理单元 (CPU) 来处理特定于应用程序的工作负载。 DPU 专为处理高速网络、存储请求和安全处理而设计,适合现代高密度数据中心和高性能计算 (HPC) 需求。
DPU 及其对应物基础设施处理单元 (IPU) 满足了从 CPU 卸载常见和吞吐量密集型任务的要求。 减少加密任务、存储 I/O 操作和高带宽网络数据包处理,使 CPU 能够专注于基于容器的应用、云或虚拟机管理程序分区以及人工智能(AI) 计算密集型任务所需的更高密度的application程序任务。
几个关键功能包括:
随着计算密度和功耗成为基础设施成本效益的新指标,优化 HCI 和 HPC 环境中特定于应用程序任务的 CPU 性能变得越来越重要。 网络速度和延迟减少、存储性能的进步以及向更多用户提供计算资源的需求进一步增加了 CPU 所需的非应用程序特定任务的负担。 目前 HPC 行业所采用的成功衡量标准是通过 CPU 密度和性能来定义的。
处理能力数据点的比例包括但不限于:
长期以来,高性能计算 (HPC) 一直使用这些测量方法来衡量超级计算机在启动时和一段时间内的性能,随着两个行业之间的技术不断融合,这些测量方法越来越多地应用于传统数据中心。
DPU 提供了一种提高application和计算密集型管道的 CPU 可用性的方法,如果需要 CPU 来处理较低级别的非计算任务,则可能会出现瓶颈。 当密度和application任务增加时,这些任务会变得更加复杂,因此 DPU 提供了一种缓解这种瓶颈的方法。 通过将 DPU 添加到数据中心基础设施,可以释放 CPU 来提供更好的每核性能。 或者,可以对计算资源进行分区和租赁,以允许更多用户访问系统资源。
在成功利用 SmartNIC、ASIC 和 FPGA 技术的基础上,F5 利用计算基础设施内 DPU 的处理和内联流量位置来增加和提高 HCI/HPC 基础设施的工作负载容量、性能和安全性。
利用 NVIDIA Bluefield-3 DPU,F5 为希望构建大规模计算资源并最大化计算资源的服务提供商和大型企业提供了多重优势。 这些包括但不限于:
更多关于DPU和F5集成解决方案的信息请点击右侧资源。
1基于科学的 HPC 测量的标准测量传统上由单精度或双精度浮点精度(FP32 和 FP64)组成。 当前的人工智能趋势现在衡量的性能水平是一半或更低(FP16)。 使用较小精度的内存寻址(浮点和整数数据类型)可以实现更快的训练和更小的语言模型内存占用。