多层SimHash检测Android恶意程序：一种新方法

150 浏览量更新于2024-08-29 收藏 831KB PDF 举报

"本文介绍了一种基于多层SimHash的Android恶意应用程序检测方法，通过深入分析APK文件的五个关键层面，包括AndroidManifest.xml、Smali代码、Java代码等，结合改进的SimHash算法和VotedPerceptron投票机制，提高了恶意软件检测的准确性和效率。" 基于多层SimHash的Android恶意应用程序检测方法是一种创新的安全技术，旨在提高对Android平台上恶意软件的识别能力。在Android应用（APK）中，恶意代码可能隐藏在多个层次，使得检测变得复杂。为了应对这一挑战，该方法采用了多层次的分析策略。首先，该方法从APK文件中提取核心组件——AndroidManifest.xml文件，这是一个XML文档，包含了应用的元数据、权限声明以及组件声明。分析此文件可以帮助识别潜在的恶意行为，如不必要的权限请求。其次，研究人员利用 Dex 文件反编译得到Smali代码，这是一种汇编级别的表示，用于理解Dalvik虚拟机执行的指令。通过对Smali代码的累加和分析，可以检测到代码模式的相似性，这有助于发现潜在的恶意代码片段。接着，从Smali文件中提取指令集，这是另一种层次的代码表示，进一步细化了代码特征的捕获。此外，方法还关注Java代码集合和Java指令集，这两个层面的分析能够捕获高级语言级别的恶意行为，如网络通信、敏感数据访问等。在这些多层次的分析中，每个层面都应用了改进的SimHash算法。SimHash是一种近似哈希技术，用于计算两个数据集之间的相似度。在恶意软件检测中，SimHash能够快速判断两个代码样本是否足够相似，从而可能存在恶意行为。通过改进，这种方法可以更好地处理Android应用的复杂性和多样性。为了集成各个层次的检测结果，研究引入了Voted Perceptron投票算法。Voted Perceptron是一种机器学习模型，它结合多个感知器（或分类器）的决策，以提高整体预测的准确性。在恶意软件检测中，每个SimHash层的结果被赋予一个信任值权重，然后综合这些权重得出最终的检测结论。这种方法能够减少误报，提高检测的鲁棒性。通过实验，该方法显示出优于传统检测手段的性能，证明了多层SimHash和Voted Perceptron的结合是检测Android恶意软件的有效途径。这种方法不仅提高了检测的精度，还能适应不断演变的恶意软件技术，对于保障移动设备安全具有重要意义。

2017 年 11 月 Journal on Communications November 2017

2017271-1

第 38 卷第 Z2 期通信学报 Vol.38

No.Z2

基于多层 SimHash 的 Android 恶意应用程序检测方法

陈波，潘永涛，陈铁明

（浙江工业大学计算机学院，浙江杭州 310023）

摘要：提出一个基于多层 SimHash 的相似度检测方法，通过对 APK 文件进行分析，最终从 5 个方面提取分析

内容来表征 APK，同时在每一层上使用改进的 SimHash 方法进行相似度检测分析。通过从 APK 文件中提取的

AndroidManifest.xml 文件、从 dex 反编译得出的 Smali 代码累加和、Smali 文件指令提取、Java 代码集合、Java

指令集提取 5 个层面进行分析。同时通过学习 Voted Perceptron 投票算法，将其应用到检测过程中，采用信任值

权重的方法，为每一层赋予一个可信值，并在最后得出结果时将每一层结果结合权重分析，实验分析结果表明该

方法具有更好的检测效果。

关键词：Android；代码检测；SimHash；Voted Perceptron

中图分类号：TP393 文献标识码：A

Android malware detection method based on SimHash

CHEN Bo, PAN Yong-tao, CHEN Tie-ming

(College of Computer, Zhejiang University of Technology, Hangzhou 310023, China)

Abstract: A new similarity detection scheme based on hierarchical SimHash algorithm was proposed. The scheme ex-

tractd contents from different aspects to represent the APK file, then used the improved SimHash to respectively represent

the file. The scheme analyzed the APK file by extracting the AndroidManifest.xml file in it, the sum of the Smali code

from the decompilation of dex file, instructions extracted in Smali files, Java code set, and instructions extracted in Java

code files. Through the study of Voted Perceptron voting algorithm, the scheme used trust weight method, by valuating a

trust weight in every layer, then combined all the result with weight in every layer as a resule of scheme, the result can be

more reasonable and more convincing.

Key words: Android, malware detection, SimHash, Voted Perceptron

1 引言

智能手机不断更新发展，不仅给人们带来了极

大的方便与快乐，与此同时，也带来了一系列的安

全隐患。隐私及敏感信息泄露、垃圾消息轰炸、恶

意扣费、系统攻击等恶意行为不仅给使用者带来了

使用上的不便，也给他们带来了经济上的损失。

Android 智能手机占据了全球手机大半市场，因其

开放性、开源性等特性被广大使用者所青睐，同时

也因此被恶意应用程序所攻击。因此，开展对

Android 恶意应用程序的探索，寻求好的检测以及

进行分类的方法具有一定的实际意义。

目前，对 Android 恶意应用程序，很多机构

以及个人都从静态检测和动态检测进行了研究与

分析。

在静态分析领域

[1,2]

，指的是在不运行应用程序

的情况下，通过逆向工程技术，提取出应用程序中

的特征然后基于对特征的分析检测应用程序。此领

域的研究者一般通过 Android 应用程序的执行指令

以及 APK 文件中反编译提取函数调用关系、权限

等方面进行分析。

动态分析方法与静态分析方法不同，它是使用

收稿日期：2017-10-28

基金项目：国家自然科学基金资助项目（No.U1509214, No.6177202）；浙江省自然科学基金资助项目（No.LY16F020035）

Foundation Items: The National Natural Science Foundation of China (No.U1509214, No.6177202), The Natural Science Founda-

tion of Zhejiang Province (No.LY16F020035)

doi:10.11959/j.issn.1000-436x.2017271

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38516380

粉丝: 3
资源: 942

多层SimHash检测Android恶意程序：一种新方法

基于卷积神经网络的Android恶意应用检测方法.pdf

基于切片的深度学习SDN恶意应用程序的检测方法.pdf

基于深度学习的Android恶意软件检测系统的设计和实现.pdf

增加隐含层的多层神经网络算法在恶意软件识别应用中的具体应用流程

Web应用程序是一种通过浏览器访问的BS结构的应用程序。

one-stage检测方法

基于视觉的目标检测方法

帮我写一篇名为一种基于Swin-Transformer的特征聚合RGB-D显著性目标检测方法的专利

基于ajax的多层架构开发项目

android aidl parcelable 多层

最新资源