2023 年兴起的许多技术值得任何技术专家关注。 其中包括数据屏蔽。 尽管在实施上与数据防泄露相似,但数据屏蔽和数据防泄露有两种截然不同的用例。
多年来,后者一直是每个领先的 Web 应用程序和 API 安全解决方案的功能。 然而,由于生成式人工智能等技术的兴起,数据屏蔽的必要性才刚刚开始被人们所认识。
数据屏蔽是一种保护敏感信息的技术,通过使用保持类似结构和格式的虚构或混乱的数据替换或混淆原始数据来保护敏感信息。 这种方法通常用于必须共享数据或用于测试、培训或分析目的,但实际敏感信息应保持保密的情况。 数据屏蔽可帮助组织遵守数据隐私法规,降低数据泄露的风险,并保护数据集中包含信息的个人的隐私。
数据防泄露(DLP) 是一套旨在保护敏感信息未授权访问、泄露或滥用的策略、政策和工具。 DLP 的主要目标是防止意外或故意泄露机密数据(例如个人信息、知识产权或商业机密)到组织网络或系统之外。
看起来市场似乎正在接受迂腐的说法并声称青苹果与红苹果不同。 毕竟,数据屏蔽和 DLP 都倾向于依赖相同的技术来“屏蔽”或“混淆”应用和 API 使用的敏感数据字段。
差异有两方面。
首先,数据屏蔽的主要用户是开发人员、数据科学家和 MLOps。 他们是需要使用真实客户数据进行测试和培训或分析的员工或合作伙伴。 这使那些宁愿保持匿名的客户面临风险,而且公司的隐私政策可能已经向他们保证他们会这样做。 DLP 用户最终就是企业。 遵守要求掩盖账户和信用卡号等敏感信息的规定是企业的责任,数据泄露会给企业带来损失。 可以说,组织采用 DLP 来保护消费者——而且他们也确实这样做了——但主要驱动力通常是监管。
其次,DLP 仅识别和屏蔽个人信息的特定子集。 当我收到账单时,我的账号是被屏蔽的,但我的姓名和地址却不是。 在数据屏蔽过程中,通常会对姓名、地址和其他识别信息进行混淆,以确保客户保持匿名。 当用例针对分析时尤其如此,出于营销或预测目的在客户中寻找模式和关系,但有理由不识别特定客户。
如果您正在制定 2024 年技术的“关注清单”,那么数据屏蔽绝对值得进入前十名。
这是因为它广泛适用于许多工作——尤其是那些倾向于分析和训练机器学习模型来收集有关客户行为的见解或发现可为商业战略提供信息的模式的工作。
随着生成式人工智能(和传统人工智能)开始渗透到地球上的每一种产品和服务中,消费者越来越意识到隐私的必要性。 能够屏蔽敏感数据将使企业既能推进人工智能计划,又能满足客户的隐私需求。