关于生成式人工智能(GenAI)的讨论随处可见。 问题是什么正在流行? 它是如何让世界变得更美好的? 商业价值在哪里? 当您考虑到组织所面临的挑战,即确定是否以及何时将 GenAI 实施到其运营中(AIOps)时,这些问题同样重要。 根据我过去一年对生成式人工智能的实验以及在 F5 日常研究期间对行业趋势的广泛了解,我提出了以下五个要点,以帮助指导那些寻求了解 GenAI 对运营数据实践影响的组织。 因此,这些组织将能够更好地将 GenAI 技术采用时间表与其现有预算、实践和文化相结合。
操作数据是半结构化数据(对象)和非结构化数据集的大杂烩。 大型语言模型 (LLM) 对于这种范围的数据格式非常灵活且有效。 这使得 LLM 成为分析操作数据集的完美技术。 组织可以在内部进行一系列实验和评估,以验证各种 GenAI 解决方案的有效性、易用性和成本。 使用 LLM 推理来检测有趣的数据模式并减少误报,可以使机器的速度和规模与使用运营数据流的团队的目标保持一致。
专注于了解哪些模型使用哪些技术来完成其手头的特定任务的组织不必构建自己的模型。 例如,命名实体识别 (NER) 是自然语言处理 (NLP) 的一个分支,它被证明是在半结构化数据中建立关键元素的有效技术。 NER 的一个示例可以是包含类别(例如星期几)或描述(例如大于 1 且小于 5 的整数)的列表。 与不支持 GenAI 的基于规则的模式匹配技术相比,推理过程中的准确性更高。 随着 NER 等技术的研究和使用实践的不断进步,运营团队可以将注意力集中在利用已被证明成功的技术上,而不是构建模型。
NER示例: 命名实体: 星期几 列表: 周日、周一、周二、周三、周四、周五、周六
数据引力是一种潜在的力量,它影响着将计算放置在更接近数据创建位置还是将数据移动到更接近计算已经部署位置的决策。 数据量越大,引力越强,导致距离数据越近的计算能力就越强。 为了训练(创建和调整模型),数据被聚合并更接近计算。 对于推理(使用模型),模型被移得更靠近发出提示的地方。
如果通过将副本带入内部来访问模型(而不是调用第三方托管的实例的 API),则将模型移近提示是有意义的,和/或将任何其他私有数据集作为提示的一部分进行矢量化。 另一方面,如果模型由 第三方通过互联网公开他们的 API,那么模型和推理操作根本就不会移动。 在这些情况下,可以使用数据中心主机托管互连将推理和私有数据向量移动到“靠近网络”的位置,或者尝试将托管位置与模型提供商进行匹配(如果可能)。
了解将数据和计算结合在一起以及将它们分开的力量有助于做出明智的选择,以寻求成本和性能之间的适当平衡。
通过 GenAI 处理,打破数据孤岛以简化和加快运营数据分析比以往任何时候都更加重要。 然而,在可预见的未来,数据孤岛似乎仍将存在,甚至会激增。
问题更多的在于如何处理数据孤岛以及做出哪些技术选择。 在访问存储在多个位置的数据时,可以选择复制和移动数据,或者实现使用联合查询的逻辑数据层而不移动数据。 无论做出哪种选择,识别现有的流数据源并评估时间/数据新鲜度约束的操作用例将帮助您选择数据技术堆栈的必要元素,例如流引擎、查询引擎、数据格式和目录。 技术选择使数据团队能够选择最有效和最易于使用的技术,同时平衡性能和成本。 理想情况下,组织的数据实践会随着时间的推移而成熟,同时始终让组织能够灵活地选择在给定成熟阶段最适合自己的方法。
当解决方案增加自动化功能时,它们可以通过将数据隐私和 SecOps 专家的隐性知识转化为可由机器执行的可重复的 AIOps 实践来扩展。 只有这样,数据、安全和隐私团队才能腾出时间来增加智能。 通过更精细地定义特定数据可被谁使用、使用多长时间以及用于何种目的,情报可以增强政策的有效性,同时跟踪数据的存储位置、制作了哪些副本以及与谁共享。 这样就可以腾出时间进行战略规划、新技术评估以及与企业沟通以完善数据访问策略和批准例外情况。
速度、规模和自动化是成熟的 AIOps 实践的特点,可带来更好的产出、更快的决策和优化的人力资本。 GenAI 正在打开技术迄今为止无法打开的大门。 当这些团队将 GenAI 实施到他们的 AIOps 中时,上述五项经验为 IT 运营、安全运营和隐私运营提供了一些参考。 人工智能模型、计算与运营数据的接近度、数据和自动化提供了新 AIOps 平台的关键部分。 在这个丰富的学习环境中,组织可以为当前和下一代构建技术运营的文化和实践。
要深入了解生成式人工智能对数据的影响,请阅读 F5 最新的数字企业成熟度指数报告。