3 个月前

基于CICIDS2017数据集的机器学习模型在计算机攻击检测中的合成

基于CICIDS2017数据集的机器学习模型在计算机攻击检测中的合成

摘要

本文研究了基于机器学习方法的计算机攻击检测模型的构建与实际应用。在现有的公开数据集中,选取了最具相关性的CICIDS2017数据集作为研究基础。针对该数据集,详细设计并实现了数据预处理与采样流程。为降低计算时间开销,训练集中仅保留了单一类别的计算机攻击(暴力破解、跨站脚本攻击XSS、SQL注入)。文中系统描述了特征空间构建的全过程,成功将原始特征维度从85维显著缩减至10个最具代表性的关键特征。在预处理后的数据集上,对十种主流机器学习模型的性能进行了全面评估。在表现优异的模型(包括K近邻、决策树、随机森林、AdaBoost、逻辑回归等)中,综合考虑模型执行时间最短这一因素,最终确定选择随机森林模型。通过准最优的超参数调优,模型性能相较于先前已发表的研究成果得到了进一步提升。所构建的攻击检测模型在真实网络流量数据上进行了测试。实验结果表明,该模型的有效性仅在使用特定网络环境中采集的数据进行训练时成立,原因在于关键特征高度依赖于网络的物理拓扑结构及所用设备的具体配置参数。因此,研究结论指出:尽管机器学习方法在计算机攻击检测中具有可行性,但其应用需充分考虑上述实际限制条件。

基准测试

基准方法指标
network-intrusion-detection-on-cicids2017Random Forest
Avg F1: 0.971
Precision: 98.2
Recall: 96.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于CICIDS2017数据集的机器学习模型在计算机攻击检测中的合成 | 论文 | HyperAI超神经