动态不等步长误差分段学习算法在非特定人语音识别中的应用

下载需积分: 9 | PDF格式 | 289KB | 更新于2024-08-12 | 80 浏览量 | 举报

"这篇论文是2002年发表在《控制与决策》期刊上的，由田岚、陆小珊和白树忠合作撰写，属于自然科学领域的论文，主要研究了基于快速神经网络算法的非特定人语音识别技术。文中介绍了一种改进的快速神经网络算法——动态不等步长的误差分段学习算法，该算法在前馈神经网络模型中被应用到非特定人的语音识别系统中，显著提高了训练速度和识别率。" 正文: 在语音识别领域，非特定人语音识别是一项挑战性的任务，因为它涉及到对任何人的语音都能准确识别，而不仅仅是预先训练过的特定个体。传统的语音识别方法往往依赖于复杂的特征提取和匹配过程，而神经网络由于其强大的模式识别能力，成为解决这一问题的有效工具。这篇2002年的研究论文中，作者提出了一个创新的学习算法，即动态不等步长的误差分段学习算法，它改进了传统的反向传播(BP)算法。在BP算法中，权重更新的步长通常是一个固定值，这可能导致训练过程收敛缓慢且可能陷入局部最小值。而在动态不等步长的误差分段学习算法中，步长不再是一个常数，而是根据当前误差和网络节点的输出动态变化，这有助于加速训练过程并更有效地寻找全局最优解。通过将这种新算法应用于前馈神经网络，构建了一个非特定人语音识别系统。前馈神经网络是一种基本的神经网络模型，其中信息沿着单一方向从输入层传递到输出层，不涉及反馈回路。在这个系统中，每个神经元负责处理一部分输入信息，并将结果传递给下一层，最终形成对输入语音的识别决策。实验结果显示，该动态不等步长的误差分段学习算法在训练速度上比标准BP算法提升了十几倍，这意味着在保持或提高识别率的同时，大大减少了训练所需的时间。此外，经过这种算法训练的语音识别网络系统展示了较高的识别性能，这表明该算法能够有效优化网络权重，提高对复杂语音模式的识别精度。关键词“非特定人语音识别”强调了这项工作的目标是创建一个对任何人说话都具备识别能力的系统，“神经网络”和“学习算法”则揭示了研究的核心是利用神经网络的模型和优化学习策略来提升识别效果。文献分类号TP183可能表示该研究属于自动化和控制理论的范畴，文献标识码A则表明这是一篇原创性研究文章。这篇论文贡献了一种新的、高效的神经网络学习算法，对于非特定人语音识别技术的发展具有重要意义，不仅提高了训练效率，而且提高了系统的识别率，为后续的语音识别研究提供了有价值的参考。

第

卷第

期

l. 17

No.l

控制与决策

2002

年

月

Jan.

2002

Control

and

Decision

文靠编号:

1001-0920(2002)01-0065-04

于快

神经网络

法的非特定人语音识别

田

岚

，陆小珊

，白树忠

(1.山东大学信息科学与工程学院，山东济南

25006IJ2.

山东大学电气工程学院，山东济南

25006

摘

要

提出一种用于语音识别的改进的快速神经网络算法，即动态不等步长的误差分段学习算法.将

步长看作误差和网络节点输出的函数，对~权值按不同步长进行动态调整，并将其应用于一个基于前馈

神经网络模型的非特定人语音识别系统。实验表明，该算法比传统

算法在训练速度土可提高十几

倍，训练出的语音识别网络系统具有较高的识别率.

关键词

非特定人语音识别，神经网络

学习算法

申圃分类号:

183

文献标识码

Speaker-independent speech recognition

based on a fast

algorithm

TIAN

Lan

, W Xiao-shan

BAI

Shu-zhong

(1.

llege

Information

ience & Engineering, Shandong University,

Ji'nan

250061 ,

China, 2.

llege

Electric Engineering, Shandong University, Ji'

nan

250061 ,

China)

画

tract:

An improved

learning

algorithm

dynamic different

step

error

segmenting

algorithm

pre-

sented

, in which

the

step

regarded

the

function of

the

error

and

the

output

function of

network

node , and weight is

regulated

dynamically by different

step.

By adopting

the

fast

algorithm

, a

speaker-independent speech recognition

system

based on a BP

set

up.

The

experiment

shows

that

the

new

algorithm

over

times

faster

than

the

traditional BP

algorithm

and

the

resulting

neural

net-

work

has

better

performance

and

spreading ability.

Key

words:

speaker-independent

speech recognition, neural

network

, learning

algorithm

主口

神经网络

(NN)

是一种与传统模式识别完全不

同的分布式并行信息处理系统，由于它具有自适应、

自组织及联想等反映人脑加工、存储和搜索信息的

某些特征，使其特别适合于语音识别这类感知问础。

基于神经网络的语音识别与传统的语音识别有

着本质的差异。传统的语音识别通常采用模板匹配

或概率模型的方法，其参考模型空间是训练样本集

经某种处理后所得的模板集或概率模型，识别时，以

待识别单元与哪个模板最接近或哪个模型产生的可

性最大作为系统的输出

而基于神经网络的语音

识别系统是对词表的总体建立模型，该模型的参数

集(或权值)通过自学习而获得，这个参数集是整个

词表的语音特征在系统中的映射，参数子集与词之

间没有对应关系。因此，基于神经网络的语音识别系

统对知识的存储是分布的[口。

收稿日期:

2001-02-03

，修回日期:

2001-04-23

侍者简介

回岚(1

965

一)

，女，山东济南人，副数授，硕士，从事语音处理及应用等研究，陆小珊(1

965

一)，男，江苏南京人，讲

师，从事通信及语音处理等研究。

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38529951

粉丝: 6
资源: 881

动态不等步长误差分段学习算法在非特定人语音识别中的应用

MATLAB实现HMM非特定人语音识别系统

"基于DTW算法的数字语音识别实现原理与实例

基于PaddlePaddle的中文语音识别模型DeepSpeech分析

win7语音识别

基于OpenCV的数字识别

基于多神经网络的语音情感识别技术研究

基于PaddlePaddle的DeepSpeech2中文语音识别模型训练指南

SpeechBrain：快速实现中文语音识别的PyTorch框架

GACNN: 基于遗传算法的神经网络框架解析

嵌入式语音识别系统：基于FPGA的LMDNOO/MB&5/PQ芯片实现

最新资源