3 个月前

使用卷积神经网络对表示为图像的恶意软件进行分类

使用卷积神经网络对表示为图像的恶意软件进行分类

摘要

每年检测到的恶意文件数量以百万计。造成此类文件数量庞大且种类繁多的主要原因之一是,为逃避检测,恶意软件作者普遍采用变异(mutation)技术。这意味着,属于同一恶意软件家族、具有相同恶意行为的文件,会通过多种技术手段不断被修改或混淆,使其外观呈现为不同的文件。为了有效分析和分类如此庞大的文件数量,必须能够将这些文件进行分组,并基于其行为识别出所属的家族。本文将恶意软件可视化为灰度图像,因其在保留整体结构的同时能够捕捉细微变化的特性,有助于识别文件间的差异。受同一家族恶意软件样本之间视觉相似性的启发,本文提出一种与文件类型无关的深度学习方法,用于恶意软件分类,该方法通过从图像化表示中提取一组判别性模式,实现对恶意软件高效聚类并识别其家族。所提出方法的适用性在两个基准数据集上进行了评估:MalImg数据集和微软恶意软件分类挑战(Microsoft Malware Classification Challenge)数据集。实验结果表明,该方法在性能上优于当前最先进的技术。

基准测试

基准方法指标
malware-classification-on-malimg-datasetGray-scale IMG CNN
Accuracy (10-fold): 0.9848
Macro F1 (10-fold): 0.9580
malware-classification-on-microsoft-malwareLBP features + XGBoost
Accuracy (5-fold): 0.951
malware-classification-on-microsoft-malwareHaralick features + XGBoost
Accuracy (5-fold): 0.9550
malware-classification-on-microsoft-malwareGray-scale IMG CNN
Accuracy (10-fold): 0.9750
Accuracy (5-fold): 0.973
LogLoss: 0.184483
Macro F1 (10-fold): 0.9400

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用卷积神经网络对表示为图像的恶意软件进行分类 | 论文 | HyperAI超神经