IRFCM：Android恶意软件检测的加权随机森林模型

PDF格式 | 750KB | 更新于2024-08-29 | 78 浏览量 | 举报

2 收藏

"基于改进随机森林算法的Android恶意软件检测，通过加权投票策略提升分类效果，利用AndroidManifest.xml文件中的Permission和Intent信息作为特征，提高了检测的精度和效率。" 在移动安全领域，尤其是Android平台，恶意软件的检测是一项至关重要的任务。传统的随机森林（Random Forest, RF）算法虽然在许多分类问题上表现出色，但其投票原则存在一个明显的局限性，即未能区分强分类器和弱分类器之间的差异。杨宏宇和徐晋在2017年的研究中，针对这一问题提出了一种加权投票改进方法，旨在增强分类器的选择性。随机森林是一种集成学习方法，它构建多个决策树并综合它们的预测结果。在默认情况下，每个分类器的权重相等，而加权投票策略则引入了权重概念，使得分类性能更优的决策树在最终决策中有更大的影响力。这种改进可以提高整体模型的准确性和鲁棒性，特别是在面对复杂或噪声数据时。在此基础上，研究者构建了一个名为改进随机森林分类模型（Improved Random Forest Classification Model, IRFCM）来检测Android恶意软件。他们选择了Android应用的元数据文件AndroidManifest.xml作为特征来源，因为该文件包含了应用所需权限（Permission）和意图（Intent）信息，这些都是评估应用行为的关键因素。通过对这些信息进行特征选择和优化，他们构建了特征向量，用于表示每个应用的行为模式。实验是在Weka数据挖掘工具环境下进行的，结果显示，IRFCM不仅在分类精度上有显著提升，而且在分类效率上也有不错的表现。这意味着该模型能够更准确地识别恶意软件，同时减少了误报和漏报的可能性，这对于实时的恶意软件防护系统至关重要。这项研究为Android恶意软件的检测提供了一种新的、高效的解决方案。通过结合加权投票策略和Android应用的特定信息，IRFCM能够更好地理解和区分良性应用与恶意应用的行为，从而提高了整体的检测性能。这种方法对于提升移动设备的安全性，防止用户受到恶意软件的侵害，有着积极的实践意义。

2017 年 4 月 Journal on Communications April 2017

2017073-1

第 38 卷第 4 期通信学报 Vol.38

No.4

基于改进随机森林算法的 Android 恶意软件检测

杨宏宇，徐晋

（中国民航大学计算机科学与技术学院，天津 300300）

摘要：针对随机森林（RF, random forest）算法的投票原则无法区分强分类器与弱分类器差异的缺陷，提出一种

加权投票改进方法，在此基础上，提出一种检测 Android 恶意软件的改进随机森林分类模型（IRFCM, improved

random forest classification model）。IRFCM 选取 AndroidManifest.xml 文件中的 Permission 信息和 Intent 信息作为

特征属性并进行优化选择，然后应用该模型对最终生成的特征向量进行检测分类。Weka 环境下的实验结果表明

IRFCM 具有较好的分类精度和分类效率。

关键词：随机森林；加权投票；恶意软件；分类检测

中图分类号：TP309 文献标识码：A

Android malware detection based on improved random forest

YANG Hong-yu, XU Jin

( School of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China)

Abstract: Aiming at the defect of vote principle in random forest algorithm which is incapable of distinguishing the dif-

ferences between strong classifier and weak classifier, a weighted voting improved method was proposed, and an im-

proved random forest classification (IRFCM) was proposed to detect Android malware on the basis of this method. The

IRFCM chose Permission information and Intent information as attribute features from AndroidManifest.xml files and

optimized them, then applied the model to classify the final feature vectors. The experimental results in Weka environ-

ment show that IRFCM has better classification accuracy and classification efficiency.

Key words: random forest, weighted vote, malware, classification detection

1 引言

Android 系统是一款基于 Linux 内核的开源操

作系统，已经成为目前市场占有量最大的移动设备

终端平台。Android 系统的开放性使它成为恶意软

件最大的发展平台，2015 年，国家互联网应急中心

捕获和厂商获得的针对安卓平台的移动互联网恶

意程序数量位居第一。随着 Android 恶意软件的占

有率逐年上升，如何将其快速高效地分析并检测出

来已经成为目前的研究热点。

目前，机器学习中的很多分类算法被应用于

Android 恶意软件检测中。文献[1]提出一种基于朴

素贝叶斯（NB, naive Bayes）的 Android 应用恶意

行为识别方法，抽取软件是否申请过多权限、是否

存在敏感权限组合等作为分类属性，通过对

Android 安全框架的扩展，实现了对恶意行为的实

时分析和处理。文献[2]利用 Android 权限间、

Android 权限和软件恶意倾向间的相关性，通过改

进贝叶斯算法实现了恶意软件的检测。文献[3]使用

Android 权限信息作为特征并采用信息增益（IG,

information gain）算法对其进行优化选择，再利用

拉普拉斯校准和乘数取自然对数对 NB 算法进行改

进，从而对 Android 恶意应用进行分析检测。然而，

上述研究只针对 Android 应用的权限信息进行检测

收稿日期：2016-12-03；修回日期：2017-02-21

基金项目：国家科技重大专项基金资助项目（No.2012ZX03002002）；中国民航科技基金资助项目（No.MHRD201009,

o.MHRD201205）

Foundation Items: The National Science and Technology Major Project (No.2012ZX03002002), The Science ＆ Technology Projec

of CAAC (No.MHRD201009, No.MHRD201205)

doi:10.11959/j.issn.1000-436x.2017073

下载后可阅读完整内容，剩余8页未读，立即下载

weixin_38516491

粉丝: 6

IRFCM：Android恶意软件检测的加权随机森林模型

基于改进随机森林算法的Android恶意软件静态检测

基于改进随机森林算法的Android恶意软件检测.pdf

基于随机森林的Android恶意代码检测系统.pdf

基于随机森林算法的Android恶意行为识别与分类方法.pdf

基于组合机器学习算法的Android恶意软件检测.pdf

基于多维度特征的Android恶意软件检测方法.pdf

基于图核的Android恶意软件检测方法.pdf

Android恶意程序检测：机器学习与随机森林算法结合的应用

基于权限和API特征结合的Android恶意软件检测方法.pdf

一种Android恶意软件检测模型.pdf

最新资源