基于TensorFlow的LSTM人体动作分类模型及94.84%准确率

需积分: 0 184 浏览量更新于2024-08-05 收藏 334KB PDF 举报

"本文介绍了一种基于长短时记忆网络（LSTM）的人体动作分类方法，该方法在TensorFlow平台上实现，并使用HDM05人体动捕数据库进行了实验验证，取得了94.84%的测试集分类准确率。" 在深度学习领域，人体动作分类是计算机视觉和人工智能的重要组成部分，尤其在医疗康复、运动训练、虚拟现实和娱乐产业等应用场景中具有广泛的应用潜力。本文主要探讨了如何利用LSTM神经网络进行人体动作的识别和分类。 LSTM（Long Short-Term Memory）是一种特殊的循环神经网络（RNN），设计用于处理序列数据，特别是长期依赖问题。传统RNN在处理长时间跨度的序列信息时可能会遇到梯度消失或梯度爆炸的问题，而LSTM通过引入门控机制（输入门、遗忘门和输出门）解决了这一问题，使其能够更好地捕捉时间序列中的长期依赖性。在人体动作识别中，由于动作往往由一系列连续的动作帧组成，LSTM的这种特性非常适合处理这类数据。在本文所提出的方法中，首先将人体动作序列转化为时间序列的形式。时间序列分析是处理动态变化数据的一种常见方法，它允许模型考虑动作随时间的变化。接着，将这些序列帧输入到正向和反向LSTM网络中。正向LSTM从序列的开始到结束处理信息，反向LSTM则从结束到开始，这样可以捕获到序列的前后上下文信息。去掉输出层的LSTM仅保留隐藏层输出，目的是获取每个时间步的特征表示。然后，使用Mean pooling层对LSTM的隐藏层输出进行池化操作，这有助于提取序列的关键信息，减少计算复杂度，同时保持重要特征。最后，将池化后的特征输入到逻辑回归层，进行分类决策。逻辑回归是一种常见的二分类模型，但在多分类任务中，通常通过多分类逻辑回归（如softmax函数）来进行。为了验证模型的有效性，研究者利用TensorFlow这个强大的开源深度学习框架实现了这一分类模型，并进行了训练。TensorFlow提供了灵活的计算图结构和高效的GPU支持，使得大规模神经网络的训练成为可能。实验数据来源于HDM05人体动捕数据库，这是一个广泛用于动作识别研究的大型数据集，包含了多种复杂的动作样本。经过训练，该模型在HDM05测试集上达到了94.84%的分类准确率，显示出LSTM网络在人体动作分类任务上的优秀性能。这个结果表明，结合LSTM和TensorFlow平台，可以构建出高效且精确的人体动作识别系统，为相关领域的研究和应用提供了有力的工具和支持。关键词涉及的人体动作分类、LSTM神经网络、时间序列分析、TensorFlow平台和HDM05数据库，都是理解本文研究内容的关键点。中图分类号和文献标志码则反映了该研究在计算机科学和技术领域的专业性和学术价值。

书书书

第

卷第

期

2017

年

月

智能计算机与应用

Intelligent Computer and Applications

Vol．7 No．5

Oct．2017

TensorFlow

平台上基于

LSTM

神经网络的人体动作分类

杨煜

，

张炜

（

哈尔滨工业大学计算机科学与技术学院

，

哈尔滨

150001）

摘要

：

随着人体运动数据采集技术的发展

，

基于数据的人体运动的研究越来越受到人们的关注

。

人体运动的研究在医疗康复

、

运动训练

、

虚拟现实

、

以及影视和游戏等领域有着很大的应用空间

。

人体动作分类就是基于大量已标注动作名称的人体动作

，

对未

标注的人体动作进行分类标注

。

在本文中

，

研究提出了一种基于长短时记忆网络

（ LSTM）

的人体动作分类模型

。

首先

，

将人体动作

表示为时间序列的形式

。

然后

，

将人体动作序列逐帧输入到去掉输出层的正向和反向

LSTM

中

，

并将隐藏层输出依次送入

Mean

pooling

层和逻辑回归层得到最终的分类结果

。

最后

，

研究利用目前流行的深度学习平台

TensorFlow

实现本次研发的分类模型并进

行训练

。

基于此

，

又进一步利用人体动捕数据库

HDM05

的数据进行实验来验证提出的分类模型

，

经过训练

，

该模型在测试集上的

分类准确率达到了

94．84%。

关键词

：

人体动作分类

；

长短时记忆网络

；

时间序列

； TensorFlow； HDM05

中图分类号

： TP183

文献标志码

： A

文章编号

： 2095

－

2163（ 2017） 05

－

0041

－

Human action classification based on L STM neural network on TensorFlow

YANG Yu，ZHANG Wei

（ School of Computer Science and Technology，Harbin Institute of Technology，Harbin 150001，China）

Abstract ： With the development of human motion data acquisition technology，the research of human motion based on data

has attracted more and more attentions． The research of human motion has great application space in medical rehabilitation

，

sports training，virtual reality，film and television，games and so on． Human action classification aims to classify unlabeled

human actions based on a large number of labeled human actions． This paper proposes a human action classification model

based on Long Short

－

Term Memory network （ LSTM）． Firstly，represent human actions as a form of time series； then，input

one human action by frame order into two LSTMs without output layer，one is forward LSTM and the other is backward

LSTM，and pass the hidden layer outputs of LSTMs into the Mean pooling layer and the logical regression layer to get the

final classification results； finally，implement the classification model and train it with the popular deep learning platform of

TensorFlow． The research uses the data of human motion capture database HDM05 to validate the proposed classification

model

，and the accuracy rate of the classification model reaches 94．84% on test set．

Keywords： classification of human actions； LSTM； time series； TensorFlow； HDM05

作者简介

：

杨煜

（ 1992

－

），

男

，

硕士研究生

，

主要研究方向

：

数据挖

掘

；

张炜

（ 1975

－

），

男

，

博士

，

副教授

，

主要研究方向

：

数

据挖掘

、

无线传感器

、

数据分析等

。

收稿日期

： 2017

－

概述

随着人体运动数据采集技术的发展

，

基于数据的人体运

动的研究越来越受到人们的关注

。

人体运动的研究在医疗康

复

、

运动训练

、

虚拟现实

、

人机交互

、

以及影视和游戏等有着很

大的应用空间

。

人体运动可以表示为人体各部分在

空间中的运

动

［1］

，

而人体动作可以看作是人体运动过程中的一个完整独

立的动作片段

，

例如可以把屈膝

、

跳起

、

落地的这一段人体运

动看作一个

“

跳跃

”

动作

。

人体动作的表示通常是基于各关

节点的位置的

［2］

或基于身体各部分的旋转姿态的

［3

－

4］

。

在本

文中

，

研究将利用人体各部分的旋转姿态来表示人体动作

，

人

体动作可以看作以一个时间序列

［3，5

－

6］

，

序列中每一帧为身体

各部分用四元数表示的旋转姿态

。

人体动作分类问题是人体运动研究的重要问题之一

。

人

体动作分类是基于大量已标注动作名称的人体动作

，

对未标

注的人体动作进行分类标注

。

人们为解决人体动作分类问题

应用了许多分类算法

。

随着神经网络的发展

，

许多研究者尝

试用已经构建的神经网络模型进行人体动作的分类并取得了

很好的效果

。

譬如

等

［2］

利用分层级联的多个循环神经网

络对人体动作进行分类

。Cho

和

Chen

［7］

将人体动作序列的

每一帧数据单独拿出来训练神经网络并进行分类

，

然后用投

票法由各帧的分类结果得出序列分类的结果

。Huang

等

［4］

在

将人体运动数据表示为李群的基础上

，

应用深度神经网络分

类人体运动

。

在本文中

，

研究构建了由双向

LSTM

神经网络和逻辑回

归层组成的人体动作分类模型

，

并用

TensorFlow

平台实现模

型的搭建和训练过程

。TensorFlow

是谷歌开源的数值计算平

台

，

其中集成了大量神经网络模型的代码实现

，

使其成为了一

个强大的深度学习平台

。

文献

［8］

中就是用

TensorFlow

实现

的基于

神经网络的手写字符识别方法

。

下载后可阅读完整内容，剩余4页未读，立即下载

zh222333

粉丝: 39
资源: 296

基于TensorFlow的LSTM人体动作分类模型及94.84%准确率

基于LSTM神经网络的TensorFlow人体动作分类研究

基于LSTM的TensorFlow人体动作分类模型

基于TensorFlow2.0实现的LSTM与GRU网络

TensorFlow平台上基于LSTM神经网络的人体动作分类_杨煜.pdf

TensorFlow平台上基于LSTM神经网络的人体动作分类.pdf

LSTM小白入门_lstm神经网络_lstm代码_LSTM_LSTM深度神经网络

LSTM深度学习.zip_LSTM_MNIST_lstm 分类_lstm分类 keras_zip

LSTM.zip_LSTM_LSTM tensorflow_TensorFlow LSTM_图像识别；

lstm_递归神经网络_short_LSTM_LSTM时间序列_lstm预测_源码.zip

double LSTM_LSTM_keraslstm_lstm预测_lstmkeras_keras_

最新资源