多时间序列样本特征提取方法在软件检测中的应用研究

版权申诉

146 浏览量更新于2024-07-10 收藏 28KB DOCX 举报

"多时间序列的样本特征提取方法以应用其的软件检测方法与流程" 本技术涉及模式识别领域，特殊是涉及多时光序列的样本特征提取办法以应用其的软件检测办法。背景技术：在模式识别领域，对机器的行为举行记录分析并按照分析结果将其分类是一种频繁的需求，所谓机器行为通常指计算机软件运行后产生的一系列对操作系统命令的调用。模式识别领域中，基于神经网络的机器行为特征提取方法是当前主流的做法。其中，循环神经网络和卷积神经网络是两种最常用的神经网络结构。循环神经网络适合处理和时光维度无关的样本，卷积神经网络更适合处理和时光维度相关的样本。在对机器行为特征的提取中，基于时光维度的采样提取其特征是重要的一个环节。早期通常认为机器产生的行为都是挨次执行的，即同一个机器产生的多个行为之间有严格的时光现后挨次，即使软件支持多线程执行也被认为不存在真正的并行而被当成单线程处理。但随着多cpu以及多核cpu的流行，机器产生的行为已经存在真正的并发及并行，也就是同一台机器会浮现真正的多个行为同时运作的状况。处理训练具有时光相关性的样本最合适的是卷积神经网络，但卷積神经网络在设计之初并没有考虑处理存在多个时光线的样本，即用卷积神经网络训练的样本假如存在多条时光线，那训练后模型预测的精确性必定会下降。而现在大多数机器产生的行为都是并发或并行的，例如一个软件运行后可以有数个线程同时运行，每个线程产生数十次或数百次不同的命令调用，同一线程上执行的命令有严格的时光现后挨次，但不同线程间的命令并没有时光现后挨次，意味着对于同一个软件每次执行后各个线程间的命令集执行挨次是随机的，这种状况下单纯采纳卷积神经网络训练模型是不合适的。通常处理这种状况的办法是，按照一定的规章将多条时光序列的命令串行拼接后再传入卷积神经网络，例如按每条时光序列上命令的数量倒序罗列，这样就将多条时光序列拼接成了一条序列，可以适用于卷积神经网络处理。还有一种做法是，将每条时光序列均分配一条卷积神经网络来处理，处理后的结果传入全衔接密度层或循环神经网络再举行融合处理。针对上述第一种按规章拼接多条时光序列的办法存在问题在于，大多数软件运行后执行命令的数量会十分浩大，例如单线程命令次数会数以万计，针对这种状况的惯用做法是将命令序列截断只取前n个命令参加训练。在实际应用中，多时间序列的样本特征提取方法可以应用于软件检测领域，例如检测恶意软件、检测异常行为等。同时，该方法也可以应用于其他领域，例如自然语言处理、图像识别等。多时间序列的样本特征提取方法是当前机器学习和深度学习领域的热点话题，也是软件检测领域的重要技术之一。

16.在其中一些实施例中，设定每列命令序列的目标命令数；在每个分组内的命令调用记录的

个数小于目标志录的状况下，采纳随机字符串补齐分组记录，否则，丢弃分组内目标命令数

以外的命令调用记录；生成命令序列，将命令序列中的每行命令调用记录的命令名称数值

化。

17.在其中一些实施例中，设定目标线程数；在分组的个数小于目标线程数的状况下，采纳随

机数值补齐分组个数，否则，丢弃目标线程数以外的分组。

18.在其中一些实施例中，所述办法应用于训练预测模型中，其中，所述预测模型的训练办法

包括：猎取多个特征矩阵以构造训练数据集，其中，每个特征矩阵以线程编号为列，以命令

编号为行，命令编号由用数值化后的命令名称表示；按照训练数据集对预测模型举行训练，

得到已训练的预测模型，其中，预测模型包括卷积神经网络或全衔接层的其中一种以及多个

循环神经网络，将每个特征矩阵作为循环神经网络的输入，将软件分类标签作为卷积神经网

络或者全衔接层的输出，训练预测网络。

19.在其中一些实施例中，“将每个特征矩阵作为循环神经网络的输入”包括：对特征矩阵中的

每列命令序列举行词嵌入运算，将词嵌入运算后特征矩阵作为循环神经网络的输入。

20.其次方面，本技术实施例提供了一种多时光序列的软件检测办法，所述办法包括：猎取待

剩余23页未读，继续阅读

Zhoudazhou

粉丝: 1
资源: 9万+

多时间序列样本特征提取方法在软件检测中的应用研究

基于VAE-WGAN的多维时间序列异常检测方法.docx

Matlab技术在时间序列预测中的应用.docx

两个docx文档，1.docx和2.docx，需要将1.docx文档中的页眉页脚复制到2.docx，用java编写，使用开源jar包，比如poi，poi-tl，docx4j等等，请注意验证你提供的代码中的方法，麻烦给我源码。

python提取docx中信息

.docx文件在vscode打开后。.docx文件发生了错误

docx.js将docx文件转为html

写一个提取.docx文档首行内容并以此重命名该文档程序

使用python将xx文件夹下的.sv文件复制到mode.docx文件并另存为.sv文件名的.docx文件

docx提取文件内容

最新资源