康卡斯特云application平台总监 Christopher Litsinger
早在 2015 年,一小群精干的工程师就着手用基于 NGINX 的内部解决方案取代商业 API 管理网关,然后将系统转换为自助服务。 一年后,他们脱颖而出,虽然成绩不佳但取得了胜利,数百项现有服务透明地迁移到了新平台。 延迟减少了,赞誉响起: “原来的 50 百分位数是新的 99 百分位数!”客户高兴地说。
这些改进带来了意想不到的增长。 两年间,托管服务的数量增加了一倍多。 数据中心来了又去。 数千个新凭证被添加到系统中。 交易率曾一度达到 2,000 RPS 的峰值,增长至 33,000。 这个小型 DevOps 团队急于停止支付商业解决方案的费用,因此做出了一项战略决策,即推迟提供自助服务。 现在,他们别无选择,只能优先考虑添加服务和凭证所需的人工,同时努力实现自助服务,然后最终向消费者提供自助服务。
在2018 年 NGINX Conf的演讲中,克里斯托弗对事件的进展进行了分析,回顾了做出的决定,并描述了他的团队从所面临的挑战中吸取的教训。