博客 | 首席技术官办公室

人工智能与 OODA 循环: 重塑运营

Lori MacVittie 缩略图
洛里·麦克维蒂
发布于 2024 年 5 月 27 日

《2025 年应用战略状况报告》的调查结果表明,在生成式人工智能和经典人工智能的推动下,运营将不可避免地转向基于 OODA 循环的模型。

您可能还记得,去年我曾指出,生成式人工智能正在重新定义运营自动化。 也许你不知道——或者也许你需要复习一下。 无论如何,这里有一个简短的回顾:

“过去,数字化最成熟的组织使用自动化根据明确的业务和运营目标执行脚本——进行配置更改并推动政策调整。 生成式人工智能的引入使得这一目标几乎成为过去,新的目标是建立一个更加自主的系统。”

这是基于去年的年度研究。 你猜怎么着? 今年的研究进一步证实了这一结论。 自主不再只是自动化领域的下一个前沿——它是运营团队现在所要求的。

我们在年度调查中要求受访者选择他们希望生成式人工智能协助完成的所有操作任务,其中排名前三的是生成和执行的结合:

  1. 57%: 生成脚本来部署新的/调整现有的配置和策略
  2. 56%: 生成策略、自定义功能和配置
  3. 55%: 执行脚本来部署新的/调整现有的配置和策略

顺便说一句,我们还提出了一个单独的问题,以确定受访者愿意让生成式人工智能自动执行哪些操作功能。 我们惊讶地发现, 99%的受访者选择了至少一项功能。

自主操作是不可避免的。

这与 OODA 循环有什么关系? 好吧,喝点咖啡,因为我要解释一下。

什么是 OODA 循环?

在 IT 运营中, OODA 循环(观察、调整、决策、行动)是一个用于快速决策和适应的连续、迭代框架。 它使团队能够主动发现问题,实时评估其影响,做出明智的决策,并迅速采取纠正措施,防止运营混乱并提高恢复能力。

  • 观察: 实时监控日志、遥测和系统健康状况。
  • 东方: 分析异常、关联警报并评估上下文影响。
  • 决定: 确定响应的优先顺序——自动化、升级或缓解。
  • 行为: 实施修复、回滚更改或部署补丁。

快速、迭代周期意味着更快的 MTTR、更少的停机时间和更智能的自动化。 这不仅仅是敏捷;这是一个不断适应的连续循环。 当应用于 IT 运营时,它改变了一切。

当今的 IT 运营

让我们面对现实:今天,我们确实没有利用 OODA 循环。 SRE 与该概念紧密相关,但大多数 IT 运营仍然处于瀑布式或敏捷式 状态。 虽然敏捷推动我们进入一种更加连续的运营模式,但它不能充分处理实时变化或快速迭代。

下表从高层次突出了这些差异:

  瀑布 敏捷 OODA
决策速度

慢的

缓和

快速地

灵活性

死板的

自适应接口

高度灵活

反馈回路

延迟(周期结束)

连续的

连续、实时

风险处理

高(晚期失败)

中等(频繁迭代)

低(快速修正)

工艺流程

线性、顺序

迭代、增量

基于循环的快速迭代

变更响应

抵制改变

拥抱变化

漏洞利用发生变化

主要目标

可预测性和结构

快速交付价值

超越并超越

大多数组织仍然停留在瀑布模式——其中一些步骤是敏捷的,但整体流程仍然是瀑布式的。 这种混合方法会减慢一切速度并产生低效率,而使用更具适应性的基于 OODA 的模型则可以消除这些低效率。

数据说明一切

我们的年度研究强烈支持向 OODA 循环的转变。 组织面临的挑战与这种方法的好处完全一致:

  • 观察 – 高配置开销:
    受访者表示,由于存在多种 API 和语言,他们花费 40-50% 的时间来管理配置。 基于 OODA 的方法,在人工智能的支持下,可以通过实时检测冗余或冲突的系统来减轻这种负担。
  • Orient – 数据整合和标准化:
    数据湖和 OpenTelemetry迈进是改善“东方”阶段的重要一步。 高质量、标准化的数据增强了情境化和关联事件的能力,从而做出更快、更准确的决策。
  • 决定——跨职能效率:
    许多受访者强调, SLO/SLI 报告和根本原因分析是受到孤立流程影响的领域。 人工智能驱动的 OODA 循环将打破这些孤岛并改善跨团队协作和决策。
  • 行动——缓慢、被动的流程:
    当前的顺序方法会延迟采取行动,直到问题升级。 通过在“行动”阶段采用实时分析和人工智能,团队可以立即部署修复,减少停机时间并防止重大事故。

结论

数据清楚地表明: 基于 OODA 循环的操作代表着未来。

各组织正在整合数据、采用人工智能并努力实现更高程度的自动化。 转向像 OODA 这样的自适应迭代模型将消除低效率、减少开销并提高响应能力。

这些工具已经存在。 唯一的问题是: 您的组织什么时候准备好搬迁?