随着我们不断向主要基于数据以及从数据中获取可行见解的能力的商业模式迈进,数据完整性问题将越来越影响业务,并不可避免地影响业务的底线。
2019年下半年,一名电子游戏(堡垒之夜)玩家引发了电子竞技行业争议。 争议的核心是他的年龄。 你知道,虽然任何年龄都可以玩这个游戏,但要想参加竞技游戏必须年满 13 岁。 奖金数额并不小;奖金杯可以让获奖者净赚数十万甚至数百万美元,这给了有天赋的孩子数百万个撒谎的理由。
去年的问题是,其中一位获奖者承认自己确实这么做了。 此举在整个游戏社区引发轩然大波,该玩家随后被禁止使用 Twitter 和流行的流媒体平台 Twitch。 这也导致了 Fortnite 社区所称的“年龄门”现象。 为了让开发商 Epic Games 能够更好地确保只有符合条件的玩家才能参加比赛,年轻玩家被迫验证自己的年龄。
当然,问题是,如果一个玩家撒谎了一次,那么就真的没有办法阻止他们再次这样做。 这总的来说是有问题的,因为它说明了验证用户提供的数据很困难。
对于那些正在寻求或进入数字化转型第三阶段的组织来说,无法验证数据的完整性(正确性)应该是值得关注的重要问题。 此阶段严重依赖数据。 这些数据不仅可用于开展业务,还将成为模式和行为识别的基础。 它将为高级分析提供动力,无需人工干预即可自动做出运营和业务决策。
而且它可能已被污染。
脏数据对业务的影响不可低估。 这不仅仅是一种旨在窃取或污染您的业务数据的 SQL 注入。 这是一种更为隐蔽的攻击类型,它采取合法交易的形式,意图误导做出商业决策的机器和人员。
产品 X 的抢购导致分析人员和业务分析师认为需求比实际情况要高。 资源的转移是为了确保供应,并随后在整个供应和分销链中产生影响。
但后来...什么都没有了。 不存在真正的需求,因为该需求是在虚假的借口下产生的。 订单突然被取消或忽略,因为它们是由机器人而不是真人下达的。 企业开始仓促应对,重新配置资源,试图应对后果。
肮脏数据对业务的影响是真实的,并且会对底线造成重大影响。
这种类型的攻击——业务层攻击——将成为数字化转型后期需要重点打击和预防的。 为了做到这一点,我们需要以牙还牙,利用数据、更多数据,甚至更多数据来帮助高级分析识别和拒绝伪装成合法交易的攻击。
这不仅仅是一个商业问题。 这是一个数据完整性的挑战,需要结合应用服务、基础设施和应用程序的数据集。 每个可被检测的插入点都必须被检测以发出强大的遥测集,从而能够通过高级分析阻止业务层攻击。 只有通过采用机器学习并利用云端的强大计算能力对大型数据集进行密集分析,才能发现能够识别破坏数据完整性的企图的细微信号和模式。 从识别机器人到识别非典型行为,区分合法业务和恶意攻击的能力对于企业的成功和生存都至关重要。
我们可能永远无法阻止孩子在网上谎报年龄——至少在使用技术方面不行。 但我们将能够利用它在脏数据方面传授的教训来构建更好的应用服务和系统,以提供针对业务层攻击的适当防御。