基于应用行为划分的Android恶意应用检测技术.pdf
《基于应用行为划分的Android恶意应用检测技术.pdf》由会员分享,可在线阅读,更多相关《基于应用行为划分的Android恶意应用检测技术.pdf(12页珍藏版)》请在咨信网上搜索。
1、第 49卷 第 9期2023年 9月Computer Engineering 计算机工程基于应用行为划分的 Android恶意应用检测技术林中霖1,时金桥1,王美琪2,3,王学宾2,3,王雨燕1(1.北京邮电大学 网络空间安全学院,北京 100876;2.中国科学院信息工程研究所,北京 100093;3.中国科学院大学 网络空间安全学院,北京 100049)摘要:在目前 Android恶意应用检测技术研究中,单维度应用特征检测技术容易被黑客针对该特征的缺点设计恶意代码,而多维度应用特征检测技术存在对新样本检测准确率低的问题。同时,基于用户交互信息的应用行为特征划分方法被广泛运用在多维度应用特征
2、检测技术上,显著提升对新恶意样本的检测准确率。但是,已有的研究工作都是通过在 UI控件上的文本信息识别用户有意识行为与应用隐匿行为,而该方法在面对简短文本信息时存在识别困难的问题。为此,设计一种基于用户交互信息的应用行为划分算法。通过捕获应用中发生的用户与应用交互行为,获取交互行为发生的时间信息并进行应用行为划分,得到用户有意识行为特征集与应用隐匿行为特征集。设计并构建一种双通道应用分类模型 2ch-LSTM-TCN,同时对用户有意识行为特征集和应用隐匿行为特征集进行学习,并对两者的计算输出统合后进行分类判别。实验结果表明,该算法的准确率和召回率分别达到 94.8%和 93.3%,能够有效区分
3、 Android良性应用和恶意应用,实现一个 Android恶意应用自动化检测原型系统。关键词:Android应用;动态分析;自动化检测;恶意行为;深度学习开放科学(资源服务)标志码(OSID):中文引用格式:林中霖,时金桥,王美琪,等.基于应用行为划分的 Android 恶意应用检测技术 J.计算机工程,2023,49(9):125-136.英文引用格式:LIN Z L,SHI J Q,WANG M Q,et al.Android malware application detection technology based on the application behavior divisi
4、on J.Computer Engineering,2023,49(9):125-136.Android Malware Application Detection Technology Based on the Application Behavior DivisionLIN Zhonglin1,SHI Jinqiao1,WANG Meiqi2,3,WANG Xuebin2,3,WANG Yuyan1(1.School of Cyberspace Security,Beijing University of Posts and Telecommunications,Beijing 10087
5、6,China;2.Institute of Information Engineering,Chinese Academy of Sciences,Beijing 100093,China;3.School of Cyberspace Security,University of Chinese Academy of Sciences,Beijing 100049,China)【Abstract】In the current research on Android malware application detection technology,single-dimensional appl
6、ication feature detection technology is prone to hackers designing malicious code based on the shortcomings of this feature,whereas the problem with multi-dimensional applications is low feature detection accuracy for new samples.Methods for classifying application behavior features based on user in
7、teraction information are widely used in multi-dimensional feature detection applications,significantly improving the detection accuracy of new malicious samples.However,most of the existing research identifies conscious user and hidden application behaviors based on the text information entered thr
8、ough User Interface(UI)controls.However,this method has difficulty in identifying short segments of text information.In this study,an application behavior division algorithm is designed based on user interaction information.By capturing the interaction between user and application,the time informati
9、on on interaction behavior is obtained,whereby the application behavior is divided to obtain the users conscious behavior and applications hidden behavior.A two-channel Long Short-Term Memory Temporal Convolution Network(2ch-LSTM-TCN)application classification model is designed,to simultaneously lea
10、rn the feature sets associated with users conscious and applications hidden behaviors,to discriminate the classification of the two feature sets after integrating the outputs from both calculations.The experimental results show that the accuracy and recall of the proposed algorithm reach 94.8%and 93
11、.3%,基金项目:广东省重点研发计划(2019B010137003)。作者简介:林中霖(1998),男,硕士研究生,主研方向为软件安全;时金桥,教授、博士;王美琪,博士研究生;王学宾,讲师、博士;王雨燕,硕士研究生。收稿日期:2023-02-06 修回日期:2023-03-17 Email:网络空间安全文章编号:1000-3428(2023)09-0125-12 文献标志码:A 中图分类号:TP3912023年 9月 15日Computer Engineering 计算机工程respectively,and can effectively distinguish between Android
12、 benign applications and malware applications,achieving an Android malware application automation detection prototype system.【Key words】Android application;dynamic analysis;automation detection;malicious behavior;deep learningDOI:10.19678/j.issn.1000-3428.00668640概述Android 恶意应用的变异是一个持续的过程。黑客通常会在下一次入
13、侵行动前改进原本的恶意代码,从而产生更隐蔽的恶意应用变体,因此,每年都会 有 大 量 新 的 Android 恶 意 应 用 被 发 现。根 据V-Test数据显示,2020年新出现的 Android恶意应用总数达到 881 万1。智能移动设备的持续发展离不开移动安全研究的支撑,并且需要一个安全的移动设备使用环境。因此,实现快速且准确的 Android恶意应用检测是一项重要的工作。恶意应用是一种不安全的软件或垃圾软件,可能会窃取用户的个人信息或损害用户设备,被分为不同的类别,例如,广告恶意软件、风险软件、短信恶意软件、银行木马等。这些恶意应用通过伪装成正常的良性应用诱使用户安装到移动终端上,进
14、而控制用户的个人终端设备,以实现其非法目的。在目前的 Android恶意应用检测技术研究中,单维度应用特征检测技术存在易被对抗的问题,而多维度应用特征检测技术存在对新样本检测准确率低的问题。同时,基于用户交互信息的应用行为特征划分方法被广泛应用在多维度应用特征检测技术上,能够显著提升对新恶意样本的检测准确率。但是,已有的研究工作都是通过在 UI控件上的文本信息识别用户有意识行为与应用隐匿行为,但是该方法在面对简短文本信息时存在识别困难的问题。针对已有方法在利用用户交互信息时存在的问题,本文设计一种基于用户交互信息的应用行为划分算法。通过从 Java层 API调用中提取用户与应用交互的时间信息并
15、进行应用行为划分,得到用户有意识行为特征集与应用隐匿行为特征集。针对传统机器学习算法模型对时序特征的学习效果较差以及长短时记忆(Long Short-Term Memory,LSTM)和时间卷积网络(Temporal Convolutional Network,TCN)等深度学习模型为单通道模型的问题,本文设计一 种 双 通 道 应 用 分 类 模 型 2ch-LSTM-TCN,通 过LSTM 模型对时序特征进行提取优化,通过 TCN 模型从时序中提取序列排序特征。1相关工作Android 系统架构可以划分为 5 层,从上到下依次是应用层、应用框架层、系统运行库层、硬件抽象层和 Linux 内
16、核层。因为 Android 系统具有以上多层结构,所以研究人员在选择特征时可以有多个维度的应用特征进行选择。本节主要对单维度应用特征与多维度应用特征在 Android恶意应用检测领域的研究成果进行介绍。1.1基于单维度应用特征的恶意应用检测关于 Android应用的检测方法,早期的研究工作主要使用单维度应用特征作为检测对象,从静态特征或动态特征的角度,又可以将基于单维度应用特征的恶意应用检测方法分为基于静态单维度应用特征的检测方法和基于动态单维度应用特征的检测方法。1.1.1 基于静态单维度应用特征的检测方法基于静态单维度应用特征的检测方法是通过从apk文件的字符串信息、dex字节码、API以
17、及类名中的某一项特征进行恶意应用检测。HE 等2模仿逆向工程分析恶意样本过程,解析敏感 API 周围的代码片段,由图神经网络识别恶意的代码片段。但是,该方法的人工操作部分占比较大,不利于流程自动化,因 此,无 法 适 用 于 大 规 模 的 恶 意 应 用 检 测。JERBI等3通过静态分析 API序列,根据一组明确定义的演化规则来演化 API 调用序列,以证明应用存在恶意行为。但是,由于仅利用 Java 层 API 作为输入特征,而忽略了 native 层 API,因此恶意应用可以通过 native层的代码逃逸其检测。文献 4-5 利用从apk 文件中提取的字节码进行静态解析并推理组件的行为
18、,通过跟踪应用程序中存在敏感流的源点和汇点,从而检测恶意敏感信息泄露。但是,以上方法无法检测到软件加壳后的恶意字节码,难以检测APT组织的高水平恶意样本。因此,静态检测方法往往具备检测速度快和部署简单的特点,但是其局限性在于难以对抗软件加壳技术和代码混淆技术,无法正确解析恶意代码。1.1.2 基于动态单维度应用特征的检测方法基于动态单维度应用特征的检测方法是指从Android 应用的执行环境中获取底层执行的硬件信息、指令信息以及 API 调用序列中的某一项来进行研究。TANG等6从系统底层收集指令信息,利用指令的特征训练无监督机器学习模型,进而检测被恶意软件感染的程序在执行过程中发生的偏差。但
19、是,该系统的部署会造成系统永久性改变,在部署过程中还需要提权,整体流程比较复杂。TAM 等7设计一个自动基于 VMI的动态分析系统,通过观察和剖析系统调用序列(重构进程间通信 IPC 和远程过程调用 RPC 交互)来重构操作系统和 Android 特定高层行为。由于重构规则需要专家来更新,因此新Android 应用功能或服务的研究需要花费大量时间成本,无法识别新功能和新服务,也就无法分类新的恶 意 Android 应 用。李 舟 军 等8构 建 一 种 运 行 在126第 49卷 第 9期林中霖,时金桥,王美琪,等:基于应用行为划分的 Android恶意应用检测技术Library 层之上的沙盒
20、,通过收集调用 Java 框架层的API调用信息并使用 API信息熵判别恶意应用。但是,该方法无法对抗软件加壳技术,对加壳保护的恶意应用没有检测能力。在应用运行过程中,不同维度的动态特征各有特点,其代表的应用信息也不同,同时具有一定的局限性。为此,若要获得一个高效的基于动态单维度应用特征的恶意应用检测方法,研究人员必须考虑其局限性且备有应对方法。1.2基于多维度应用特征的恶意应用检测为提升检测技术被对抗的难度以及更好地应对新型的恶意样本,研究人员开始研究多维度应用特征组合在恶意应用检测技术上的效果。文献 9 表明利用多维度应用特征能够提高检测 Android 恶意样本的效率,然而,不同维度的应
21、用行为特征可以反映 Android应用程序上不同属性的差异。目前,基于多维度应用特征的恶意应用检测方法分为基于静态多维度应用特征的检测、基于动态多维度应用特征的检测、基于用户交互信息与动态多维度应用特征的检测。1.2.1 基于静态多维度应用特征的检测方法基于静态多维度应用特征的检测方法是指通过apk 文件的字符串信息、dex 字节码、API、包类信息中等多种应用特征进行恶意应用检测。QIU 等10开发一种新的多视图特征智能框架,提取多视图异构特征,包括语义字符串特征、API调用图特征和 smali操作码序列特征,实验结果表明,其性能和效果均优于经典方法 Drebin11。BAI等12提出一种基
22、于多种特征的恶意应用检测框架 FAMD,从样本中提取权限和 Dalvik 操作码序列来构建原始特征集,实验结果表明,组合特征可以有效提高恶意软件在 Drebin数据集上的检测准确率,在恶意软件家族分类上准确 率 可 达 97.38%。文 献13设 计 的 检 测 模 型TSDroid 将 API Level作为描述 API生命周期的时间特征,还将 apk文件大小、dex文件大小以及系统 API的数量作为空间特征,结合 2 类特征集训练恶意应用分类模型。ZHANG 等14提出利用 N-gram 分析和特征哈希化,从应用程序中提取多维度应用特征,通过综合每种维度应用特征的分类结果来判断应用的恶意程
23、度。然而,已有工作对不同维度应用特征组合效果相关的问题缺少关注。因此,组合后多维度应用特征的分类效果还需进一步分析并验证。1.2.2 基于动态多维度应用特征的检测方法基于动态多维度应用特征的检测方法是指利用在应用运行过程中产生的字符串信息、指令序列、API 调用序列、数据流等多种维度的应用特征进行恶意应用检测。文献 15 使用静态多维度应用特征训练出的恶意应用识别准确率达到 97.12%,使用动态多维度应用特征训练出的准确率为 86.18%,然而动静态混合的多维度应用特征训练出的识别准确率为 96.29%。文献 15 选择动静态混合的多维度应用特征的分类效果相较于使用静态的多维度应用特征较差。
24、其原因为选取的静态特征和动态特征并无关联性,而动态特征的检测效果与静态特征相比较差,因此,组合后混合特征的分类准确率受动态特征的影响而下降。因此,部分多维度应用特征在组合后有可能会对算法产生负面效果,多维度应用特征组合需要经过分析后再利用。1.2.3 基于用户交互信息与动态多维度应用特征的检测方法Android 应用是根据用户的需求进行设计与开发的,通过用户与应用的交互信息也可以反向推测用户与应用的行为意图。研究人员从多维度应用特征中抽象出用户行为意图和应用行为意图,以提升对 Android恶意应用检测的准确率。文献 16 根据疑似恶意应用 UI 控件的可疑度对应用软件进行针对性动态测试。UI
25、控件的可疑度是依据 UI控件上的文本信息来设置的,而基于 UI 控件可疑度设计的动态测试方法对恶意样本检测的漏报率为 18.3%。文献 17 对 UI控件所反映应用意图与应用行为之间的关联性进行研究,实验结果表明,UI控件所反映应用意图与应用行为之间的差异用于区分恶意的 Android应用。但是,在不同上下文中 UI 控件的图标和文本可能出现类似的情况,例如,登出界面里的“确认”键和文件发送界面的“确认”键在图标和文本信息上存在相似的情况,导致语义解析结果相同。用户交互信息有利于提高特征集的分类效果,但是基于 UI控件文字信息与动态 多 维 度 应 用 特 征 的 检 测 方 法 还 存 在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 应用 行为 划分 Android 恶意 检测 技术
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。