博客

多云可扩展性和灵活性支持 AI 工厂

Buu Lam 缩略图
布林
2024 年 11 月 11 日发布
奥布里·金缩略图
奥布里·金
2024 年 11 月 11 日发布

在 F5 的 AI 工厂系列中,我们介绍和定义了 AI 工厂,探索了它们的元素以及应用交付和安全选择如何影响性能。 在本文中(即本系列文章的第五篇)中,我们探讨了多云网络在为AI 工厂提供推理和支持数据移动方面所发挥的关键作用, F5 将其定义为满足大容量、高性能训练和推理要求的海量存储、网络和计算投资。

F5 的 AI 参考架构图

探索分布式架构:位置影响工作负载性能

分布式互连点是AI工厂的核心,推动存储、网络和计算基础设施的运行。 当企业设计其人工智能工厂时,许多服务可能会物理地位于同一数据中心内或附近。 然而,有些服务可能在地理上分布。 如果将前端应用、推理服务和所需模型等服务架构在靠近需要使用的地方,它们将提供最佳性能。 此外,如果设计需要检索增强生成 (RAG)知识语料库数据,则可能会涉及 RAG,但目前我们将重点关注前端、推理服务和模型部署。

f5-ai 参考架构中的 ai-factory

推理服务和前端应用

根据谷歌列出的来自世界领先组织的 185 个真实生成式 AI 用例,我们观察到其中许多公司依靠战略位置为全球客户提供 AI 工作负载。 当考虑最终用户体验时,必须关注并精心策划人工智能工厂的分布式架构。 在F5的2024年application战略状况报告中发现,88%的组织采用混合云模式运营。 据报道,94% 的受访者面临多云挑战。

多层安全:从软件定义网络 (SDN) 中学习

那么,实现 AI 工厂和推理实例之间的安全、优化通信的最佳方法是什么? 答案与网络有关。 为了理解原因,让我们回顾一下服务提供商之外大多被忽视的行业流行词:软件定义网络(SDN),它对于 4G 和 5G 等 3GPP 架构的安全至关重要。 3GPP 架构的安全成功可归因于坚持严格的应用隔离。

SDN 通过实施第 2 层和第 3 层零信任原则提供了强大的解决方案,其中除非通过软件定义的确定性路由基础设施进行验证和处理,否则流量无法路由到应用。 这确保了应用的每个组件都可以在本地和全局独立扩展,以实现最佳性能和安全性。 此外,SDN 按名称而不是 IP 地址路由应用流量,从而缓解 IP 地址重叠等问题,并允许在不同区域和环境中无缝扩展应用和安全解决方案。 SDN 内的显式路由和隧道也能为潜在攻击提供强大的防御能力,因为未授权访问需要 SDN 内的资源所有权以及遵守严格的通信协议。

大型一级电信公司一直在大规模展示这些原则的有效性,将它们应用于 AI 工厂的多云网络 (MCN) 中更大的工作负载是有意义的。

如何确保 AI 规模的连接安全

这听起来很简单,对吧? 您正在阅读本文的智能手机可能具有 GPU、5G 连接和密码。 你应该适合去做私人保安吧? 嗯,不完全是。 现在,我们来讨论三点。 然而,要知道这些只是一个开始,当你为你的 AI 工厂设计和建模威胁形势时,还会发现更多的问题。

首先,我们来谈谈速度。 当生成式人工智能于 2022 年底通过 ChatGPT 首次引起轰动时,我们专注于文本数据。 然而,到 2024 年,我们越来越多地看到围绕其他模式(例如图像、视频、文本和数据)的用例混合到基于专业化的流程和应用层模型中。 在分布式 AI 工厂架构中,将所有模型部署到各处可能并不可取或不可行。 它可能归结为数据重力、功率重力或计算要求等因素。 在这里,您可以选择高速网络互连来弥补差距并缓解将依赖服务彼此移开时所面临的性能问题。

我们还来看一下模型盗窃,这是 OWASP 大型语言模型 (LLM) 和生成式 AI 应用的十大风险之一。 任何希望利用生成式人工智能来获得竞争优势的企业都会将其知识产权纳入该系统。 这可能是通过使用公司数据训练他们自己的模型或对模型进行微调来实现的。 在这些场景中,就像您的其他业务系统一样,您的 AI 工厂正在通过您必须保护的模型创造价值。 为了防止分布式架构中的模型被盗,必须确保该模型、模型的更新以及应用需要访问的数据源都已加密并应用了访问控制。

最后,让我们考虑模型拒绝服务,这也是 OWASP 针对 LLM 和生成式 AI 应用的 Top 10 之一。 随着人们对人工智能应用的信任度不断提高,它们在关键系统中的使用也随之增加——无论这意味着对您企业来说是一个重要的收入驱动系统,还是对医疗保健场景等生命维持至关重要的系统。 必须设计访问前端和推理的能力,以便任何可能的进入方式都是有弹性的、受控的和安全的。 这些访问场景可能适用于最终用户访问以及从推理服务回到核心 AI 工厂。

内置可见性、编排和加密

安全的多云网络解决方案支持设计 AI 工厂架构的分布式方面所需的连接性、安全性和可见性。 F5 分布式云网络连接可解决上述所有问题,甚至更多。 分布式云网络连接还提供独特的客户边缘解决方案,实现通用连接,无论您是在公共云、您自己的或同地数据中心运行推理,还是在您选择的硬件边缘运行推理。 简单快速地部署,客户边缘自行建立连接。

  • 连接速度F5 分布式云服务建立在全球高速互联网络上,该网络是世界上对等网络之一。 企业可以确信,他们的 AI 工厂已经将最快的连接融入到他们的分布式服务中。 分布式云网络连接支持快速配置站点,使企业能够立即提供AI服务。
  • 与安全连接: 分布式云网络连接默认是安全的。 连接是加密的,并允许完全控制什么可以连接到 AI 工厂和分布式服务以及什么不能连接。 此外,客户端边缘可用于支持我们迄今为止讨论的范围以外的服务,包括 Webapplication和 API 保护 (WAAP)。
  • 与可见性连接: 分布式云服务还提供基于 SaaS 的控制台,该控制台提供丰富、数据丰富的仪表板,分享对网络任何部分的应用连接健康状况的见解。 这使得团队能够主动识别可能出现问题的地方,并在问题加剧之前解决它。

设计你的人工智能工厂并非易事,企业希望在确保最大程度安全的同时尽快获得人工智能带来的好处。 能够可靠地部署 AI 工厂的多种安全功能将允许更快地进行创新,同时腾出时间专注于带来真正业务差异化和竞争优势的AI 工厂的方面。 如果您想了解有关多云网络的更多信息,请观看我们的Brightboard 课程或探索F5 分布式云网络连接

F5 对 AI 的关注不止于此——探索F5 如何随时随地保护和交付 AI 应用