论文部分内容阅读
由于移动应用程序的激增、分发渠道的多极化、安全攻击方法的多样化,Android恶意应用的检测与分类研究面临极大挑战。与此同时,人工智能和机器学习方法的兴起,不断延伸出新的技术和算法来分析和检测恶意应用。有别于传统的基于特征序列的检测方法,深度学习模型能够更好地挖掘恶意特征和行为,从而更有效率地分析与检测恶意应用。本文即围绕Android恶意应用的分类与检测问题,开展基于深度学习的方法研究及其关键技术,主要工作包括:(1)基于词向量的语义文本建模方法,结合Android恶意应用的特点和恶意行为执行流程,提出了基于word2vec的特征向量化表示方法。具体而言,在恶意特征提取阶段,从应用描述和代码行为两个维度自动抽取程序的组件信息、权限及敏感API调用;在向量化表示阶段,采用word2vec构建恶意应用向量模型,将文本特征抽象成高维实数向量,以表征恶意应用特征间的相似性与关联性。经实验证明,该方法可以更好地表征恶意应用。(2)分析深度学习模型在恶意应用检测中的应用,设计并实现了基于深度神经网络的Android恶意分类模型OP-DBN。针对深度学习模型构建的复杂度高、耗时大等关键问题,提出特征精简和样本优选的新方法。具体而言,首先基于随机森林的平均不纯度减少策略,优先选择重要性较高的特征作为分类器的特征,再使用聚类算法对现有样本进行聚类,提取中心样本作为训练样本,最后融合工作1的特征表示方法,基于word2vec构建的特征向量模型,提出恶意应用的分类模型DP-S-DBN。实验结果显示,准确率为99.25%,训练时间较OP-DBN缩短了36.7%,既可明显提升训练效率,也能提高准确率。(3)研制了一个Android恶意应用检测和模型评估平台的原型系统,并通过集成多种反病毒查杀引擎实现当前业界部分检测方法的评估,可应用于Android恶意样本的搜集、检测引擎的评估、安全威胁情报分析等,推动基于深度学习的Android恶意应用分析技术的发展。