博客

NetOps 需要的是支持者而非对手

Lori MacVittie 缩略图
洛里·麦克维蒂
2018 年 12 月 13 日发布

当您准备享用一整天期盼的美食时,却发现食物还没煮熟。 您感到很沮丧,于是严厉地斥责服务员,甚至可能减少他们的小费。 尽管这不是他们的错,他们却笑着接受。 毕竟,他们没有准备你的饭菜。 但他们是您与厨房的接口,最终,他们要为看不见的故障付出代价。

无论是餐厅的服务员,还是<在此处插入服务>的客户服务代表,当出现问题时,与您打交道的人通常最先承受着您的焦虑/沮丧/愤怒。

在数据中心也是如此。

由于 IT 正在进行数字化转型,目标是实现更高的优化和速度,因此 NetOps 团队最有可能与内部“客户”互动,因此当流程进展不及预期时,他们首当其冲地承受着用户不满的冲击。

重要的是要认识到,阻碍部署最新事物/应用程序/服务的并不总是“NetOps”。 当组织寻求转变 IT 运营时,速度的障碍通常是由于未能采用 DevOps 的所有前提。 

您是在进行 DevOps 还是只是进行自动化? 

CAMS是传播DevOps核心理念最常用的手段。 CAMS 代表:文化自动化测量共享

在这四种技术中,自动化最有可能受到人们的热烈欢迎。 在追求提高 IT 服务速度的过程中,其他三个方面往往被抛在后面或完全被忽略。

特别值得注意的是,这三个常常被忽视的概念是相互交织的。 当团队仍然按职能孤立且专注于对其他团队不重要的指标时,很难改变文化。 我们努力工作以达到我们所期望的衡量标准。 如果我们要衡量网络正常运行时间,那么这就是我们要关注的重点——即使我们的运营同行正在努力提高应用的正常运行时间。

也就是说,您可能还记得网络自动化状况研究,我们与 Red Hat 联手深入研究了 DevOps、NetOps 和自动化的模糊世界。 其中,我们发现 NetOps 所追求的指标(测量)与参与开发和运营的指标(测量)之间存在很大差异。

近四分之三(73%)的 NetOps 将“网络正常运行时间”作为其主要指标。 另一方面,59%的开发人员和运营人员告诉我们“应用正常运行时间”是他们的主要指标。 相反,按部署频率衡量的开发人员和运营人员(30%)几乎是 NetOps(16%)和安全(17%)的两倍。

这种差异为何如此重要? 如果我的主要目标是保持网络可用,那么我就会花时间专注于网络。 仪器仪表和监控——后者对于 DevOps 的共享组件至关重要——将首先关注网络,然后才是应用。 如果有时间的话。 没有人有时间考虑安全问题,而且也没有人会对此进行衡量。 事实上,安全性方面首要的衡量标准是<请击鼓>“网络正常运行时间”,59% 的安全专家对此指标进行了测量。

人员仍然是 IT 的核心,并且组成了必须实施自动化和编排的团队,但他们并不一定朝着相同的目标迈进。 造成这种错位的一个因素是作战域的持续孤立。 NetOps 和安全小组更有可能在“单一功能”团队的架构下工作。 NetOps 担心网络。 安全? 安全。 运营? 系统操作。

但事情远比更深刻。 因为大筒仓里面还有更小的筒仓。 就像俄罗斯套一样,NetOps 中有许多不同的团队,看似简单的“新站点”请求必须经过这些团队的审核才能完成。 在满足这样的请求之前,必须配置和启动大量的基础设施和应用服务。 新站点不仅意味着托管它的计算和网络资源,还意味着一系列其他要求。 网络服务器及其存储。 访问控制。 证书和密钥管理。 负载平衡。 防火墙规则。 这个“简单”请求必须穿越的 IT 内部孤岛列表很长。

如果 NetOps 孤岛中的一个孤岛没有实现自动化,整个过程就会戛然而止。 满足此类请求所需的时间可能需要几天甚至几周的时间。

对于外部而言,对于请求者而言,NetOps 似乎没有成功完成工作。 正是这些“对应方”、“联络人”和“IT 合作伙伴”承受着人们的焦虑,他们要求知道为何需要花这么长时间来满足一个看似简单的要求。 我们指责 NetOps,就像技术新手将互联网故障归咎于本地提供商一样,而问题实际上是出在其他提供商管理的主干网深处的路由器上。 

做倡导者,而不是对手

对于许多组织来说,向更具协作性、更透明的 IT 转变仍然只是眼前的一个转折点。 尽管 IT 领域的一些团队看到了这种需要并接受了必要的变革,但并非所有团队都这么做。 在我们对应用服务进行研究的五年中,我们并没有看到“DevOps”达到真正启动文化和组织变革所必需的战略重要性水平,而这种变革对于实现企业想要和需要的速度是必需的。 相反,组织接受了自动化——而忘记了对 DevOps 至关重要的其他三个组件。

未能认识到 DevOps 在 IT 领域的发展不仅仅涉及自动化,这一点令人担忧。 人们没有意识到,如果要提高速度,就必须实现管道自动化,而该管道几乎遍历 IT 内的每个操作域和孤岛。 这意味着每个受影响的人都必须走向自动化,否则你将无法实现所追求的部署速度和频率。 你不能仅仅接受自动化并期望获得成功。 当自动化必须跨越孤立群体之间的界限时,如果没有重大的文化变革,你将会失败。

所需的变革必须自上而下进行。 特别是组织变革。 我们不能很好地重新组织自己,不是吗? 我们不能重新调整目标的优先顺序并使用一套完全不同的衡量标准,不是吗?

我们不能,除非我们教育并说服那些可以做出必要改变的人,否则我们将发现自己在原本自动化的流程中陷入手动流程。

因此,我们不要再把 NetOps 当作替罪羊,并认识到他们也可能会感到沮丧。 相反,提醒决策者需要重新评估组织结构并重新确定衡量标准的优先顺序,以更好地与业务和其他连续渠道保持一致。 

对着前线的网络作战人员大喊大叫也许会让人感觉很爽,但实际上并不能改变最初引发愤怒的情况。 如果不做出改变,管道就不会变得更快。

成为您的 NetOps 的拥护者,而不是他们的对手。 他们需要一切可能的帮助。