汉语大词表孤立词语音识别束搜索算法优化

需积分: 9 150 浏览量更新于2024-08-11 收藏 350KB PDF 举报

"大词表孤立词语音识别的快速搜索算法 (2011年)，清华大学学报(自然科学版)，作者：梁维谦、原道德、丁玉国，刊载于2011年51卷第1期，19/27页，101-104,110页， ISSN1000-0054，CN11-2223/N，关键词：语音识别、音节切分、束搜索，中图分类号：TN912.3，文献标志码：A，文章编号：1000-0054(2011)01-0101-04" 在大词表孤立词语音识别领域，Viterbi搜索算法是处理的关键步骤，但由于其计算量大，导致了系统运行时间的显著增加。针对这一问题，研究者们提出了一个创新的解决方案，即基于音节切分的束搜索算法。这个算法旨在优化Viterbi搜索，通过在音节层和词条层实施剪枝策略，以减少不必要的计算，同时不增加额外的内存需求。孤立词语音识别主要应用于语音识别系统中，尤其在处理大量词汇的情况下，效率至关重要。汉语孤立词识别有其独特的挑战，例如声母、韵母和声调的组合多样性。该算法利用这些特点，通过音节切分来降低复杂度，将大的词汇表分解成更小的单元进行处理。实验结果显示，当词表规模达到10000个词汇时，采用这种新的束搜索算法，虽然识别率轻微下降了0.23%，但Viterbi搜索的时间消耗却降低了73.27%，仅为基线系统的四分之一。这表明该算法在提高处理速度方面取得了显著成效。特别是在处理大词表时，相较于小词表的情况，该算法对于系统性能的提升更为突出。束搜索算法的核心在于限制搜索空间，通过设置一定的阈值来提前排除低概率路径，从而加速搜索过程。在汉语环境中，结合音节的特性进行剪枝，能够更有效地缩小搜索范围，提高效率。这一方法对于实时语音识别系统，如智能助手、语音交互设备等，具有重要的实践意义，因为它能够在保持较高识别准确率的同时，显著缩短响应时间，提升用户体验。这项工作为大词表孤立词语音识别提供了新的优化思路，通过音节切分和束搜索算法的结合，实现了速度与准确性的平衡，对于推动语音识别技术的发展具有积极的贡献。后续研究可能进一步探索如何在不同语言和方言环境中应用此算法，以及如何优化剪枝策略以实现更好的性能。

ISSN

1000-0054

清华大学学报(自然科学版)

2011

年第

卷第

期

19/27

101-104

110

11-2223/N

Tsinghua

Univ

(Sci &

Tech)

201

51,

No.1

大词表孤立词语音识别的快速搜索算法

梁维谦原道德

丁玉国

(1.清华大学电子工程系，北京

100084;

清华大学微电子学研究所，北京

100084;

北京凌声芯语音科技有限公司，北京

100085)

摘

要:在大词表孤立词语音识别中，

Viterbi

搜索是时间

消耗的主要因素。为改善基线系统性能，根据汉语孤立词识

别的特点，提出了一种基于音节切分的束搜索算法，在音节

层和词条层进行剪枝。该算法不增加内存开销。实验结果

表明

在词表规模为

10000

时，该算法以

0.23%

的识别率下

降率为代价，将

Viterbi

搜索的时间消耗降低为基线系统的

26.73%

;相对于小词表，该算法在大词表情况下对系统性

能的改善尤为明显。

关键词:语音识别

音节切分;束搜索

中图分类号:

912.3

文献标志码

文章编号:

1000-0054

(201

01-0101-04

Fast

algorithm

for

large vocabulary

isolated-word speech recognition

ANG

Weiqian

YUAN

Daode

DING

Yuguo

(1.

Department

Electronic Engineering, Tsinghua University,

Beijing 100084,

China;

Institute

Microelectronics

Tsinghua University ,

Beijing 100084,

China;

3. Beijing VoiceOn Speech Corporation, Beijing 100085,

China)

Abstract:

large vocabulary isolated

word

speech recognition,

the

Viterbi

the

major

time consumes.

The

performance of

the

baseline

system

is improved using

the

characteristics of isolated

Mandarin

words

in a syllable detection based beam

algorithm

with

pruning

of syllable and word levels.

This

algorithm

has no

additional

memory

cost.

Tests

show

that

for vocabulary

with

10000

words

the

algorithm

reduces

the

time

consumption

26.73%

the

baseline

system

, while

the

recognition

rate

is reduced

only

The

performance is improved even more

when

the

vocabulary contains

words.

Key words:

speech

recognition; syllable

detection;

beam

嵌入式孤立词识别是目前语音识别领域的一个

重要应用方向

[1-2J

其广泛应用于

GPS(global

posi-

tion

system)

地名检索、电话簿查询、声控点歌等系

统中。由于嵌入式系统软硬件资源有限，必须优化

大词表孤立词识别算法，以提高其实时性问。

时间同步宽度优先的飞

Titerbi

搜索算法

[4J

是目

前基于

HMM

(hidden

Markov

modeD

的语音识别

所广为采用的方法。对于孤立

词语音识别，

Vit

erbi

搜索的时间消耗与词表规模近似成正比。当词

表规模增大到一定程度时，

Viterbi

搜索将成为识

别算法的主要时间消耗因素。为在识别率和识别速

度之间寻求合适的平衡点，必须采用适当的剪枝

策略。

基于

HMM

的孤立词识别的基本原理如图

所示

[5J

提取待识别语音的特征，得到对应的观察

矢量;逐条为词表中的词条建立识别网络并计算其

对观察矢量的输出概率;选择输出概率最大的词条

作为最优结果。

最优结果

图

基于

HMM

的孤立词识别原理

剪枝是指在某一时刻保留最有可能向后延伸的

若干路径而删除可能性较小的路径

[6J

可以在词条

层、音节层和状态层进行。孤立词的识别网络为线

性

HMM

链，识别时逐词条进行概率计算，故剪枝

多在词条内部进行。

收稿日期:

2009-10-16

基金项目

国家"八六三"高技术项目

(2008AA010700)

作者简介:梁维谦(1

977-)

，男(汉)

，黑龙江，助理研究员。

E-mail:

lwq@mai

tsinghua.edu.cn

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38686231

粉丝: 10
资源: 917

汉语大词表孤立词语音识别束搜索算法优化

大词表连续语音识别系统的研究与实现.nh

大规模词表连续语音识别引擎紧致动态网络的构建 (2012年)

大词表连续语音识别技术解析

紧凑动态网络优化：大规模词表语音识别效率提升

N-gram算法与词表结合的新词识别技术研究

优化Viterbi搜索：语音识别系统中的快速算法研究

停用词表停用词.txt

java笔试题算法-werdlists:用于编写软件安全测试用例的词表、词典和其他数据集

构建单字词表识别未登录词的方法 (2015年)

停用词 词表 中文停用词

最新资源

停用词词表中文停用词