这篇博文是关于人工智能工厂的系列文章之一。 当您完成此处的操作后,请浏览该系列的其他帖子。
当 ChatGPT 于 2022 年 11 月发布时,我们提出的问题和输入的提示很简单: “给我讲一个关于 X 的故事”和“就主题 Z 写一篇人物 A 和人物 B 之间的叙述”。 通过这些问题以及当时与 GPT-3.5 的初步互动,我们试图确定这项新兴流行技术将如何影响我们的日常生活。 现在到了 2024 年末,人工智能将补充我们的生活:帮助我们调试和编写代码、编译和汇总数据、驾驶自动驾驶汽车等等。 这些都是现代人工智能工厂的产出,而我们才刚刚起步。
本文是人工智能工厂系列文章的第一篇,探讨了人工智能工厂的组成部分以及不同元素如何协同工作以大规模生成人工智能驱动的解决方案。
在人工智能的发展过程中,人工智能工厂的概念已经成为一种流行,用来比喻人工智能模型和服务的创建、完善和部署方式。 与将材料转化为成品的传统制造工厂非常相似,人工智能工厂是一项巨大的存储、网络和计算投资,可满足大容量、高性能的训练和推理要求。
在这些工厂中,服务器网络、图形处理单元 (GPU)、数据处理单元 (DPU) 和专用硬件协同工作,处理大量数据,执行复杂的算法,训练 AI 模型以实现高水平的准确性和效率。 这些基础设施经过精心设计,可以处理训练大规模模型和部署实时推理所需的巨大计算能力。 它们采用先进的存储解决方案来管理和检索海量数据集,确保无缝数据流。
负载平衡和网络优化可最大限度地提高性能和资源利用率,防止瓶颈并确保可扩展性。 这种硬件和软件组件的协调使人工智能工厂能够生产尖端的人工智能模型并不断改进它们,以适应新数据和不断变化的需求。 最终,人工智能工厂体现了人工智能开发的工业化,提供了支持下一代智能应用所需的强大基础设施。
正如 NVIDIA 首席执行官黄仁勋在 Salesforce Dreamforce 2024 大会上所说,“历史上,计算机技术的发展速度从未超过摩尔定律”,他继续说道,“我们的发展速度远远超过了摩尔定律,甚至可以说轻松超越了摩尔定律的平方。”
由于人工智能投资是关键的市场差异化因素和运营效率的驱动因素,因此大规模部署人工智能变得越来越重要。 为了实现这一目标,组织需要不断构建和完善模型并整合知识库和实时数据。 人工智能工厂的概念强调人工智能应该是一项持续的投资,而不是一次性的努力。 它为组织提供了一个实施其人工智能计划的框架,使其更适应不断变化的业务和市场需求。
F5 利用我们帮助客户大规模部署高性能、安全的现代应用群的专业知识,开发了 AI 参考架构框架。 鉴于人工智能应用是现代应用中最现代化的,通过 API 紧密连接且高度分布,该框架解决了交付尖端人工智能应用所必需的关键性能、安全性和运营挑战。
在我们的参考架构中,我们定义了构建综合 AI 工厂所需的七个 AI 构建模块:
概述前端应用和推理服务 API 之间的交互;主要向 AI 模型发送请求并接收响应。 这为更复杂的互动奠定了基础。
通过添加大型语言模型 (LLM) 编排和检索增强服务来增强基本推理。 它详细说明了从矢量数据库和内容存储库中检索额外上下文,然后用于生成富含上下文的响应。
专注于检索增强生成 (RAG) 推理所需的数据摄取过程。 它包括数据规范化、嵌入和填充矢量数据库,为 RAG 调用准备内容。
旨在通过与模型的交互来增强现有模型的性能。 它无需从头开始重建模型即可调整模型,并强调使用 RAG 从推理和推理中收集数据以进行微调工作流程。
涉及从头开始构建一个新模型,尽管它可能使用以前的检查点(重新训练)。 它涵盖数据收集、预处理、模型选择、训练方法选择、训练和验证/测试。 这个迭代过程旨在创建针对特定任务的稳健模型。
将 LLM 编排层连接到数据库和网站等外部源。 它将外部数据集成到推理请求中,但不包括分块和嵌入等文档预处理任务。
涵盖开发、维护、配置、测试和部署 AI应用组件的工作流程。 它包括前端应用、LLM 编排、源代码控制管理和 CI/CD 管道。
这些构建模块共同构成了人工智能工厂的骨干。 每个部分在人工智能输出的创建、部署和改进中都发挥着至关重要的作用。 此外,人工智能工厂计划倾向于拥有大多数构建模块的实施策略(而不是租赁或外包),从而从下面列出的部署模型中选择自托管。
对于每个构建模块,客户必须选择适当的部署模型和实施策略(自有、租赁或外包),定义实现其 AI 计划业务目标的最佳参考架构。 以下是前四名:
您日常所依赖的 F5应用交付和安全功能与精心设计的 AI 工厂所至关重要的功能相同。 F5 BIG-IP 本地流量管理器与 F5 rSeries和VELOS专用硬件配对,可实现 AI 训练的高性能数据摄取。 F5 分布式云网络连接用于安全的多云网络连接不同的数据位置,为RAG创建从专有数据到 AI 模型的安全管道。
F5 对 AI 的关注不止于此——探索F5 如何随时随地保护和交付 AI 应用。
有兴趣了解更多有关 AI 工厂的信息吗? 探索我们的 AI 工厂博客系列中的其他内容: