博客

全球弹性: 在云中断期间保护关键基础设施

Chin Keng Lim 缩略图
陈庆林
2024 年 10 月 16 日发布

CrowdStrike 近期造成的全球性中断给许多组织敲响了警钟。 公司董事会正在询问首席信息官如何减轻下一次全球性停电的影响,因为停电可能会导致他们的关键任务应用中断(但这不是他们的错)。 世界各国政府也在思考如何防止这种全球性中断对基本公共服务造成附带损害,特别是对银行、交通和医疗保健等关键信息基础设施 (CII)。

根据Gartner 最近关于构建数字弹性的报告,绝大多数组织(88%)都已制定了明确的数字弹性战略。 然而,云服务提供商 (CSP) 和软件即服务 (SaaS) 安全提供商的全球中断继续对组织产生附带影响。 这表明,目前大多数组织实施的数字弹性策略可能没有考虑到 CSP 和 SaaS 安全提供商的单点故障。

计划外的应用停机不仅仅是违反合规性;它还会导致客户不满,从而可能导致客户转而选择竞争对手。 这意味着停机可能导致多层次的损失,但努力保护您的基础设施和应用也可以带来更好的合规性,更令人满意的客户体验,同时有助于降低基础设施成本。

了解本地运营与云端运营的总成本是关键。 云计算具有成本效益,因为它具有弹性,可以适应使用量激增,并通过即用即付模式降低成本。 如果关键任务应用部署采用主动-主动混合云设计模式,并且将现有硬件的生命周期纳入计算,那么您将看到大幅的成本节省——根据戴尔的研究,人工智能(AI) 工作负载的成本节省最高可达 75%。

什么是全球弹性?

全球弹性是指组织承受、适应和恢复全球基础设施故障和网络攻击的能力。 它涉及制定策略、能力和基础设施,以防止、检测、应对和恢复全球中断。

全球弹性的一个关键方面是维护强大的基础设施,其中 IT 系统和网络灵活、可扩展并且能够处理意外负载或故障。 这是通过利用多云环境并最大化云提供的价值来实现的。

同样重要的是保持网络安全的最高效率。 必须实施强有力的安全措施来防范网络威胁,同时确保数据完整性和可用性——而不会引入单点故障。 至关重要的是要认识到,许多基于云的网络安全 SaaS 解决方案在架构上都是单点故障,这意味着当它们出现故障时,其客户将遭受附带影响。

适应性流程对于全球弹性来说也至关重要。 企业需要开发灵活的运营工作流程,以便快速适应环境、市场条件或技术的变化。 这确保了面对新挑战时能够快速转变的能力。

企业可以采取哪些措施来提高全球韧性?

企业在构建全球弹性应用时需要关注三个关键行动。

  1. 将应用分为四个层级
    首先识别您的应用并将其分类为以下层级:

    • 关键任务应用: 需要全球弹性,确保无论在什么情况下它们始终能够运行。
    • 关键业务应用: 全球弹性是可选的,但建议使用以减少中断。
    • 商业运营应用: 维持正常运行但不需要全球弹性。
    • 行政应用: 非必要应用支持业务功能,但对于即时连续性并非至关重要。
  2. 将全局弹性设计模式映射到每个应用层
    根据层级,企业可以实施不同的弹性模式:

    • 分布式部署:
      • 分层混合: 前端应用部署在云中,而现有的后端系统仍保留在本地。
      • 分区混合: 将公共云和本地结合在主动-主动部署中,提供针对单站点故障的弹性并优化成本。
      • 分析混合: 分离在线事务处理 (OLTP) 和在线分析处理 (OLAP) 任务,允许公共云处理复杂的分析,同时维护内部部署的核心操作。
      • 边缘混合: 在本地管理时间敏感、业务关键的工作负载(例如,网络边缘的 AI 推理),同时使用云/本地执行其他任务。
         
    • 冗余部署:
      • 冗余模式: 根据生产和开发需求在不同的云或环境之间分配工作负载。
      • 业务连续性混合模式: 利用公共云故障转移实现经济高效的冷备用系统。
      • 云爆发模式: 私下处理基线工作负载,并在需要时转移到云端以获取额外容量。
  3. 为每一层定制全球弹性参考架构
    企业应该基于这些应用层建立参考架构。 这是部署现有和新工作负载、缩短价值实现时间以及协调技术和业务弹性需求的战略指南。 对于关键任务应用来说,“分区混合”设计模式至关重要。 这意味着在本地和云环境中部署相同的前端,以确保能够抵御单站点故障。 通过遵循这些步骤,企业不仅可以保障其运营,还可以获得在全球云驱动环境中蓬勃发展所需的灵活性。
通过为每一层定制弹性参考架构,可以增强全局弹性。
通过为每一层定制弹性参考架构,可以增强全局弹性。

是否有关于全球复原力的框架?

组织可以采用多种数字弹性框架和模型来增强其应对和恢复中断的能力。 一些值得注意的框架包括:

  • 美国国家标准与技术研究院 (NIST) 网络安全框架
  • 国际标准化组织 (ISO)/国际电工委员会 (IEC) 27001
  • 信息和相关技术控制目标 (COBIT)
  • 信息技术基础设施库 (ITIL)
  • 业务连续性管理 (BCM) 框架
  • 数字运营弹性法案 (DORA)
  • 能力成熟度模型集成 (CMMI)

通过采用这些框架,组织可以创建一种结构化的方法来增强其数字弹性并更好地应对潜在的中断。

全球复原力的关键战略

确保全球弹性需要应用具有高可用性、可扩展性和强大的安全性。 组织可以通过利用提高性能和保护的关键技术来实现这一目标。

ADC: F5 的 BIG-IP 应用交付控制器 (ADC)、F5 NGINX ADC 和分布式云应用交付控制器即服务 (ADCaaS) 可以优化流量分配并跨数据中心、云和混合环境扩展应用,以确保可用性和性能。

网络安全: Web应用防火墙 (WAF)、应用编程接口 (API) 安全和拒绝服务 (DoS) 防护等工具可以保护应用免受网络威胁,即使在遭受攻击时也能确保连续性。

云和混合部署: 多云网络和混合设置提高了灵活性,能够快速响应中断。

自动化和编排: 自动化应用交付和安全可减少错误并缩短响应时间,从而增强弹性。

可见性和分析: 实时监控和分析可以主动应对性能问题和安全威胁。

通过实施这些技术,组织可以确保其应用在不断变化的数字环境中保持可用、可扩展和安全。

制定全面的全球弹性战略

在当今互联互通的世界中,构建全球弹性对于维护应用的完整性至关重要。 通过关注应用交付、强大的网络安全和适应性云策略等关键领域,组织可以更好地保护其服务免受中断并扩展以满足不断变化的需求。 实施自动化并实时了解系统性能可以进一步增强弹性。 通过全面、深思熟虑的方法,企业可以确保其应用保持可靠、安全并随时应对未来的挑战。

10 月 15 日至 17 日,欢迎前往新加坡金沙会展中心GovWare的 P06 展位与我们交流,我们将在那里分享有关如何构建和加强网络和云弹性以及如何在任何地方保护、交付和优化应用程序的见解。