近日,F5在 Elsevier Network Security 期刊上发表了一篇研究论文,涉及对各种机器学习(ML)/人工智能(AI)框架的实证分析,以确定以分布式方式运行 ML/AI 算法的性能和有效性。 该研究探索使用不同的 ML/AI 先进框架(如 NVIDIA 的 Morpheus、ONNX、TF/SKL 等)来大规模显著提高网络安全。 这提高了检测能力,通过优化模型格式和 GPU 支持的并行工作负载处理实现了这一点。 软件优化和硬件加速的结合不仅减少了延迟,而且提高了整体吞吐量。
我们选择了检测算法生成域 (AGD)的问题来比较不同的 ML/AI 框架 (NVIDIA 的 Morpheus、ONNX、TF/SKL)。 一般来说,攻击者使用域生成算法(DGA)来生成 AGD,以便通过 DNS 层进行数据泄露和命令与控制(C&C)通信。 我们使用 DGA 威胁检测模型来测试各种 ML/AI 框架。
用于检测 AGD 的 ML/AI 模型已在给定的平台上部署并执行,批次大小为 32 和 1024。 在给定的批次大小下,GPU 配置的性能分别比 TensorFlow 实现的 CPU 配置高出 11 倍和 43 倍。 使用 ONNX 模型格式,CPU 执行提供程序在批次大小为 32 时的性能比 TensorFlow CPU 好 5 倍,在批次大小为 1024 时的性能比 TensorFlow CPU 好 1.5 倍。 对于批次大小为 32 和 1024 的情况,带有 CUDA GPU 执行提供程序的 ONNX 的性能分别比带有 CPU 执行提供程序的 ONNX 好 6 倍和 13 倍。 Morpheus-GPU 的表现优于其他架构,在批次大小为 32 和 1024 的情况下分别实现了 22382 请求/秒和 208077 请求/秒的吞吐量。 与 TensorFlow-GPU 配置相比,吞吐量提高了 200 倍。
在我们的分析中,我们发现 Morpheus-GPU 提供了卓越的延迟和吞吐量,从而能够使用更大的批量来服务大型网络。 使用 Morpheus-GPU 和缓存可以对数据中心级 DNS 流量进行实时 DGA 检测。
这项研究的主要结论如下:
组织可以利用这项研究来实现人工智能加速的网络安全,通过选择强大的基础设施(处理单元和 ML/AI 框架的组合)来大规模处理数据,以快速且可扩展的方式获得推理结果。 该研究允许组织在现有产品中使用与 ML/AI 框架相关的验证结果来实施方法,特别是在 ML/AI 领域。
请从网络安全期刊在线门户获取该论文的副本。