博客

借助 NVIDIA Cloud Partner 参考架构,F5 为你大规模加速并保护 AI 推理

Ahmed Guetari 缩略图
艾哈迈德·盖塔里
2025年10月28日发布
Ash Bhalgat 缩略图
阿什·巴尔加特
2025年10月28日发布

F5 服务提供商产品管理副总裁 Ahmed Guetari 与 NVIDIA AI 网络与安全生态系统高级总监 Ash Bhalgat 共同撰写了本文。

人工智能正在迈入一个新时代,推理性能与安全已经成为满足客户期望的关键。 在代币经济快速发展的今天,AI 基础设施已远不止依赖原始算力。 你需要协同管理、全面防护,并持续扩展从云端到边缘数据中心的推理能力。 作为云运营商,你在打造生成式 AI 和推理平台时,必须提升 GPU 效率、扩大令牌处理能力、降低延迟,并全面保障 AI 基础设施的各个层级安全。

F5 通过利用NVIDIA Cloud Partner (NCP) 参考架构扩展推理能力,帮助你应对各种挑战。 这一核心蓝图为领先的 AI 云提供商如何设计、构建并运营 GPU 加速的基础设施提供了清晰的方向。 参考架构融合了计算、网络、存储和安全等领域的顶尖技术,确保 NVIDIA 云合作伙伴能够为你交付稳定、高性能且可扩展的 AI 服务。

通过合作,我们让 F5 BIG-IP 成为 NVIDIA 生态系统中实现安全高速推理的关键力量。

F5 正与 NVIDIA 深度整合网络、安全和应用交付能力,助你打造智能、令牌驱动的 AI 平台。 我们正在重新定义大规模 AI 部署,帮助你获得新一代代币经济所需的速度、安全和智能。

NCP 参考架构: 助你构建 AI 云的坚实基石

NCP参考架构为你构建AI云环境提供了系统化方案。 我们将NVIDIA的加速计算、网络和软件优势,与领先生态伙伴的创新技术相结合,让你在云端轻松实现高性能、可扩展、安全的AI解决方案。

在这一架构中,F5 BIG-IP 为 GPU 驱动的 AI 工作负载赋能,带来了先进的流量管理、零信任安全、更多高级服务以及可观测性,帮助你高效、自信地部署、扩展和保护推理服务。

代币经济崛起及 NCP 参考架构

对于AI云提供商和企业来说,令牌已成为新的价值单位——你需要关注吞吐量、总延迟、首个令牌到达时间、能效以及单个令牌的成本。 你必须依靠强大的基础设施,把用户与GPU集群高效连接,才能取得成功。 要顺利地交付高性能AI服务,你需要让流量路由、防护、可观测性、多租户支持和策略执行都以线速运行,避免出现任何瓶颈。

NCP 参考架构为这份蓝图提供了标准。 它明确了主权云与 AI 云该如何实现计算、网络、存储、遥测和安全的互联。 NVIDIA BlueField-3 DPU是这些架构中实现南北向流量的核心。

F5 以一流的网络基础设施推动者身份加入多云生态系统,把网络、安全和 AI 感知控制直接集成到参考架构中。

F5: 我们助力 NCP AI 云在性能、安全和效率上全面提升

F5 整合 NVIDIA 技术,已经带来了显著成效。 2025 年 4 月,F5 宣布适用于 Kubernetes、采用 NVIDIA BlueField-3 DPU 加速的 F5 BIG-IP Next全面上市。 你可以把网络处理、安全控制和流量智能都卸载到 DPU 上,让 CPU 专注支持业务应用。 最近接受云概念验证测试的 NCP 软银,也取得了优异的性能表现

F5 BIG-IP 不仅具备强大性能,还能全面满足 NCP 的运营需求。你可以通过一次操作实现统一出入口策略控制、服务网格、分布式拒绝服务攻击防护、零信任安全、API 保护、工作负载隔离和多租户可观测性。

在合作过程中,我们优化了大型语言模型(LLM)的路由逻辑、基于令牌的流量计量与管理,并支持模型上下文协议(MCP),让你能在数据路径上拥有更强的掌控力和智能化能力。

我们通过支持 NCP 参考架构,让 BIG-IP 成为 AI 云建设、部署和治理体系中的核心组成部分。

提升 AI 处理效率: 令你处理的 Token 增加 30%,TTFT 提升 60

早期验证结果显示极具说服力。 你在将 F5 BIG-IP 服务与 NVIDIA 加速计算平台联合部署后,令牌生成量提升了 30% 以上,首次令牌生成时间(TTFT)降低了 60%。

你将获得更长时间、更贴合上下文的响应,更快的推理速度,每个 token 的成本还能降低 30%。 结合单位能耗下更高的 token 处理能力,生态集成让你在提升性能的同时显著提高能效,这两者都成为 AI 时代经济的新核心。

作为云客户,您使用 NCP 能收获显著优势:加速业务价值实现,降低运维成本,每种部署模型都能优化用户体验。

你获得的成效已远超小幅改进,AI云正让你在服务交付、保护和变现方面实现结构性跃升。

F5 在 NCP 参考架构中的三大核心支柱

F5 纳入 NCP 参考架构后,我们将帮助你在部署 AI 服务时提升性能,加强安全,并拓展功能,覆盖以下关键领域:

1. 性能提升: 为代币经济而生: F5 BIG-IP 能与你的 NVIDIA GPU、DPU、网络结构以及 NVIDIA Dynamo、NVIDIA NIM 等软件平台组件深度集成,极大提升 AI 推理吞吐量。 借助 F5 方案,你可以优化请求路由、负载均衡和推理效率,有效消除瓶颈,让每个集群每秒处理更多代币。

当你所用的每一个代币都能提升收益和模型准确率时,我们帮助你获得更高效率,更快响应,实现更大盈利空间。 F5 与 NVIDIA 携手合作,全面释放加速型基础设施在新兴代币经济中的潜力,让高效与卓越性能真正推动你的业务发展。

2. 为 AI 推理提供全新安全防护: 大规模的 AI 推理为你带来新的攻击面,从数据暴露到模型端点被滥用,风险持续升级。 F5 凭借应用安全和策略实施方面的深厚经验,将专业能力直接融入 NVIDIA 参考架构,为你的 GPU 云从核心到边缘构建多层防护。 主要包括:

  • 为推理 API 提供高级 DDoS 防护和自适应流量隔离。
  • 我们帮你在各类环境中实现零信任和基于策略的身份管控。
  • 我们为你提供完整的第 7 层防火墙和 MCP 安全,保障端到端流量的安全可靠。
  • 我们为你提供全面的数据保护,助你轻松应对全球合规与隐私要求。

你将获得值得信赖的 AI 网络,同时兼顾高性能与强防护,让 NCP 客户能够安心扩展,无需担心安全或合规风险。

3. 功能拓展与AI原生控制: F5与NVIDIA联手,除了提升吞吐量和安全性,还为你带来覆盖GPU集群的全新增值服务,增强控制力、可视性和智能水平。 你可以借助LLM请求路由、精细令牌管理、自适应可观测性、上下文感知的流量调度等能力,实时优化工作负载分配和资源利用效率。

这些功能为人工智能领域引入了企业级的应用交付能力,确保你能精确高效地处理每一个令牌、每个模型和每次用户互动。 F5 帮助你将复杂变为可控,让传统应用无缝融入迅速发展的生成式 AI 世界。

AI基础设施全新账本

我们将 F5 的能力与 NCP 参考架构深度融合,助你搭建面向未来的新型账本体系,让吞吐量、Token 成本、延迟、能效与安全在 AI 基础设施设计中成为核心要素。

基于这一基础,AI 云平台可以实现更可预测的扩展,更透明的变现,同时还能随着模型和工作负载的变化更快地响应和调整。 NCP、企业和主权云都能依托经过验证的参考架构,兼顾信任与性能。

F5 不只是加入 NVIDIA 生态系统。 我们携手推动代币经济进步,让每一微秒、每一瓦特、每一个代币都发挥价值。 作为实现安全、高性能、具经济扩展能力的 AI 基础设施的重要推动者,F5 正联手 NVIDIA,帮助你更高效、更快速、更安全、更智能地生成代币。

我们期待与您——无论是客户、合作伙伴还是创新同行——携手共创新一代高标准的人工智能服务。 欢迎访问我们的F5 与 NVIDIA 网页,了解更多详情。