目前最热门的流行语之一就是AIOps。 它被用来描述从支持技术(运营数据和分析平台)到自动化响应所需的工具(又称自动化)的一切。
人们常常将AIOps一词与其中一种技术混淆,但实际上 AIOps 是一种总体运营方法,其唯一重点是实现自适应应用。 即适应条件的应用以保持可用性、优化性能并确保安全性。
事实上,AIOps 不仅仅涉及自动化。 它不仅仅是关于遥测(操作数据)或机器学习发现的见解。
这绝对不是要除掉人。 AIOps 作为一种力量倍增器变得越来越重要,它使可管理的运营人员能够处理不断增长的数字业务组合。
在运营方面,人工智能可以使运营有效地扩展、保护并提供企业在数字化为默认的世界中运营所需的不断增长的数字服务和产品组合。 运营需要机器协助有两个原因:
即使采用现代运营方法(SRE、云),运营引入的变化仍然主要由人驱动。 运营决策由人做出、由人制定并由人投入生产。 与使用敏捷开发的应用非常相似 方法最终与交易(传统)部署模型发生冲突以提供数字服务,我们的模式是混合的。 配置变化以一种非常交易的方式进行传达,由人工填写“表格”,然后将其提交给自动化系统进行部署。
毫不奇怪, 63% 的高管表示,设置管道基础设施时涉及太多手动流程。 我们自己在 2021 年进行的研究发现,目前使用 SRE 实践来运营基础设施和应用的组织比例低得令人不安。 然而,IT 和业务领导者更希望实现这些流程的自动化。 目前已经具备了技术能力。 系统已经具备获取和处理相关数据并制定适当政策的能力。 结合通过调整操作条件的 API 执行这些策略的能力,连续管道中剩余的手动流程的自动化是可以实现的。
然而,自动适应的能力需要整个 IT 领域进行重大变革。 它不能像我们过去尝试做的那样,被简单地固定住。 例如,为了满足遥测需求,我们长期依赖需要代理和模拟的传统监控解决方案。 当工作负载发生迁移时,以及对于容器而言是短暂的,这种方法会以运营成本和时间的形式增加不可接受的开销。 基础设施、平台和应用中的本机仪器必须成为支持实时自适应架构的标准。
同样,我们看到安全举措和解决方案未能阻止新出现的攻击,因为它们往往是在发现威胁后才采取的权宜之计。 本土安全和总体治理对于确保安全措施适应不断演变的攻击所带来的持续威胁是必要的。
因此,需要对操作进行改进。 混合运营模式无法扩展以服务完全数字化的业务。 由于依赖手动、人为决策和任务而将自动化系统纳入其中,从而导致无法预测变化时间,并带来人为错误的风险。
为了解决这种低效率问题并降低风险,需要采取更具适应性的架构方法。 应用可以根据需要自行增长、缩小、防御和修复,几乎不需要人工干预。
下一次运营变革的决定性特征是适应性,我们称之为自适应应用程序。
Adaptive Apps不是一个产品。 它不能以盒子形式购买并部署在服务器上。 这是一种重塑运营的架构方法,重点是实现数字化组织的适应性。 换句话说,应用和服务就是当今商业的数字化面孔。
这不是一个小的变化。 当各组织竞相“上网”时,互联网的第一波浪潮所造成的颠覆将随着各组织努力向全数字化实体运营的方向发展而再次发生。 必须从每个相关系统(仪器仪表)生成操作数据,并将其输入到一个整合的数据平台中,机器学习将在该平台上对其进行分析,以发现隐藏的关系和模式,从而获得对应用和数字服务的安全性、可用性和性能至关重要的见解和信息。 这些信息和见解随后必须推动基础设施、应用和系统的变革,从而自动调整策略和配置,以阻止攻击、解决故障并优化性能。
这些功能非常广泛,而且比简单地迁移到云端或分布到边缘需要付出更多努力。 数字业务的核心——企业架构——必须进行现代化改造,以纳入那些以前不存在但未包含的元素,但现在必须存在以支持机器学习、分布式应用以及跨核心、云和边缘的自动化。
____
要了解有关 IT 现代化(包括运营)的更多信息,您可以从 O'Reilly (f5.com/dea)获取《数字业务企业架构》的免费副本。