
摘要
在通过移动网络连接的物联网/信息物理系统(IoT/CPS)领域中,传统的入侵检测方法通过使用异常检测技术分析多个设备之间的网络流量来标记潜在的安全威胁。然而,这些方法面临着显著的隐私挑战,特别是在深度包检查和网络通信分析方面。这种类型的监控具有高度侵入性,因为它涉及检查数据包的内容,而这些内容可能包含个人和敏感信息。此类数据审查通常受到严格的法律和法规约束,尤其是在智能家居等环境中,数据隐私至关重要。合成数据提供了一种有前景的解决方案,它可以在不泄露敏感细节的情况下模拟真实的网络行为。生成模型如生成对抗网络(Generative Adversarial Networks, GANs)可以生成合成数据,但在像网络活动这样的专业领域中,它们往往难以生成真实的数据。这一局限性源于训练数据不足,这阻碍了模型充分理解和掌握该领域的规则和约束条件。此外,训练数据的稀缺性加剧了入侵检测方法中的类别不平衡问题。为了解决这些挑战,我们提出了一种以隐私为导向的框架,该框架利用知识注入的生成对抗网络生成合成网络活动数据(Knowledge-Infused Network Activity Generation using GAN, KiNETGAN)。这种方法增强了分布式入侵检测系统的鲁棒性,同时解决了隐私问题。我们的知识引导GAN通过严格的实验验证产生了网络活动的真实表示。我们证明了KiNETGAN在下游任务中保持了最小的准确性损失,有效地平衡了数据隐私和实用性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| synthetic-data-generation-on-unsw-nb15 | kiNETGAN | EMD: 0.07 |
| synthetic-data-generation-on-unsw-nb15 | CTGAN | EMD: 0.07 |