博客 | 首席技术官办公室

大多数缺失的洞察都是由于数据偏差造成的

Lori MacVittie 缩略图
洛里·麦克维蒂
2021 年 7 月 26 日发布


在一百人中,只有五个人能够从他们用来跟踪其数字资产的性能、可用性和安全性的众多监控工具中获得所需的洞察

其余九十五? 他们或许正盯着可爱但无效的维恩图。

维恩图

缺乏洞察力的原因之一不是缺乏工具,甚至不是缺乏数据;而是数据中持续存在的偏见。

持续数据偏差

数据偏见是由系统内的主观管理造成的。 主观策展是针对所有事项做出的决策的结果,包括收集哪些数据、从哪个系统收集数据,以及如何在仪表板上显示可视化效果。

数据偏差的最重要来源之一是基于代理的系统的遗留问题,这需要在您想要收集数据的任何系统上部署额外的软件。 代理商通常与分析平台配对,过去这些产品的定价通常包含代理商的费用。 当然,对于大规模部署来说会有折扣,但仍然是一项昂贵的提议。

部署和管理代理的成本引入了数据偏差,因为它限制了可以收集数据的系统。 关于监控特定应用或系统的价值的意见(无论是否有经验)通常都会影响部署决策。

生成的数据量也是持续偏见的来源,因为它会导致基于对特定数据点的价值的看法而做出的决策。 您真的需要所有这些指标吗,或者我们可以将其限制为三到四个吗? 对指标的主观性管理意味着无法验证整体数据的变化或改变。 这些转变或变化可能预示着潜在的问题或风险,但由于数据被认为无关紧要而被忽视。

最后,仪表板上关于可视化的决策会进一步影响解释,而且通常基于可能不会与使用仪表板的其他人共享的技能和经验。 甚至图表的选择也可能会引入偏差。 对于基于时间序列的运营指标(如性能和正常运行时间)尤其如此。

两张图表

条形图通常用于绘制时间序列数据,但影响力不如折线图。 条形图迫使我们比较条形的高度来了解响应时间的变化,而不是让线条的形状来告诉我们正在发生的事情。 这些简单的决定可能会对依靠可视化来洞察系统运行状态的操作员产生深远的影响。

所有这些决定都会不断地将偏见引入数据,并影响我们解释数据的能力,从而影响我们洞察数据真正含义的能力。

消除数据偏差

如果我们想要在数字化的世界中做出更好的决策,我们就需要更好的数据,这意味着我们要尽可能地消除数据偏见。

这是OpenTelemetry如此有前景的原因之一。 使用开源(因而成本较低甚至免费)代理来标准化遥测数据的生成和提取方式,将在很大程度上消除数据偏见的根本原因之一:IT 预算。 通过确保您可以从每个系统(而不是仅仅从少数被认为“有价值”的系统)收集遥测数据,您可以消除数据中的一个重要偏见来源。 这就是为什么我们的边缘愿景包括将遥测生成嵌入到平台本身的概念,以便它在任何地方都可用。

数据湖即服务也可以成为一种有效的手段,解决由于存储量和成本随时间推移而引起的管理偏差。 通过外包规模和容量,组织可以更自由地获取更多遥测数据,从而更容易发现影响性能等的异常和模式。 在过去五年中,我们看到此类服务的数量不断增加,通常被归为 XaaS 类别的一部分,并且正在以越来越快的速度消耗 IT 预算。 德勤在今年的XaaS报告中指出,近一半的企业将把至少一半的IT支出分配给XaaS。

最后,通过从可视化迁移到洞察,可以解决仪表板传递运营数据时出现的偏见问题。 洞察力不仅仅显示时间点的数据快照,还根据在数据中发现的模式和关系提供信息。 更重要的是,洞察力可以消除因依赖二元指标而导致的不必要的消防演习。 现代系统的设计就是为了能够自动发生故障并恢复。 每当发生这种情况时收到通知都会引起警报疲劳,从而降低生产力。 在整个用户流程中分析遥测的能力意味着了解故障组件何时需要干预以及何时不需要干预。 从依赖于解释多种可视化的模式转变为利用全面的洞察可以消除可视化中固有的一些偏见。

随着业务接近默认数字化模型,它必然会越来越依赖数据。 消除数据中的偏见是确保基于数据做出的决策能够为客户和企业带来最佳结果的关键一步。