什么是数据处理单元 (DPU)?

数据处理单元 (DPU) 是一种专用处理器,旨在卸载和加速以数据为中心的任务,释放中央处理单元 (CPU) 来处理特定于应用程序的工作负载。 DPU 专为处理高速网络、存储请求和安全处理而设计,适合现代高密度数据中心和高性能计算 (HPC) 需求。

深入了解 DPU

DPU 及其对应物基础设施处理单元 (IPU) 满足了从 CPU 卸载常见和吞吐量密集型任务的要求。 减少加密任务、存储 I/O 操作和高带宽网络数据包处理,使 CPU 能够专注于基于容器的应用、云或虚拟机管理程序分区以及人工智能(AI) 计算密集型任务所需的更高密度的application程序任务。

几个关键功能包括:

  • 联网: 基于智能网络接口卡 (SmartNIC) 的功能,DPU 可以接近线速的速度处理大量数据包流,提供包括 VXLAN 在内的网络覆盖卸载,并提供安全和application交付控制器服务,如防火墙支持、TLS 卸载、负载均衡和流量路由。 此外,DPU 可以为加密安全伪随机数生成器 (CSPRNG) 提供熵源。
  • 贮存: DPU 可加速主机和存储之间的数据传输,支持高级存储协议,例如非易失性存储器快速传输协议 (NVMe) over fabrics (oF) 协议,从而提供固态存储和超融合基础设施 (HCI) 所需的更快速度。 DPU 还提供加密/解密支持、压缩和重复数据删除处理,进一步减轻 CPU 的负载。
  • 虚拟化: 卸载虚拟机管理程序和基于容器的网络任务可提高分区和租户 HCI 基础设施以实现更高工作负载密度的能力,从而提高基础设施的投资回报率。

使用 DPU 的优势

随着计算密度和功耗成为基础设施成本效益的新指标,优化 HCI 和 HPC 环境中特定于应用程序任务的 CPU 性能变得越来越重要。 网络速度和延迟减少、存储性能的进步以及向更多用户提供计算资源的需求进一步增加了 CPU 所需的非应用程序特定任务的负担。 目前 HPC 行业所采用的成功衡量标准是通过 CPU 密度和性能来定义的。

处理能力数据点的比例包括但不限于:

  • CPU 核心数量(按机架、节点或用户可用总数)
  • 每秒浮点运算次数 (FLOPS)1
  • 功耗(以平均和峰值千瓦为单位)
  • 物理空间测量(以平方英尺或米为单位)

长期以来,高性能计算 (HPC) 一直使用这些测量方法来衡量超级计算机在启动时和一段时间内的性能,随着两个行业之间的技术不断融合,这些测量方法越来越多地应用于传统数据中心。

DPU 提供了一种提高application和计算密集型管道的 CPU 可用性的方法,如果需要 CPU 来处理较低级别的非计算任务,则可能会出现瓶颈。 当密度和application任务增加时,这些任务会变得更加复杂,因此 DPU 提供了一种缓解这种瓶颈的方法。 通过将 DPU 添加到数据中心基础设施,可以释放 CPU 来提供更好的每核性能。 或者,可以对计算资源进行分区和租赁,以允许更多用户访问系统资源。

F5 如何与 DPU 协同工作?

在成功利用 SmartNIC、ASIC 和 FPGA 技术的基础上,F5 利用计算基础设施内 DPU 的处理和内联流量位置来增加和提高 HCI/HPC 基础设施的工作负载容量、性能和安全性。

利用 NVIDIA Bluefield-3 DPU,F5 为希望构建大规模计算资源并最大化计算资源的服务提供商和大型企业提供了多重优势。 这些包括但不限于:

  • 简化集成: F5 将网络、安全、流量管理和负载均衡结合到一套专注于 DPU 集成的整合服务中。 它提供了跨 HCI/HPC 基础架构的这些服务的集成视图,以及优化计算密集型工作负载所需的可观察性和精细控制。
  • 增强的安全性: F5 通过将这些功能卸载到 DPU 来支持关键安全功能,包括防火墙、分布式拒绝服务 (DDoS) 缓解、API 保护、加密和证书管理。
  • 改进的性能: F5 加速网络和安全,这对于满足高密度基础设施在云规模上交付应用的需求至关重要。
  • 多租户支持: F5 支持可扩展的多租户架构,允许服务提供商在同一基础架构上安全地托管大量租户,同时保持其工作负载和数据的独立和安全。

更多关于DPU和F5集成解决方案的信息请点击右侧资源。


1基于科学的 HPC 测量的标准测量传统上由单精度或双精度浮点精度(FP32 和 FP64)组成。 当前的人工智能趋势现在衡量的性能水平是一半或更低(FP16)。 使用较小精度的内存寻址(浮点和整数数据类型)可以实现更快的训练和更小的语言模型内存占用。