ISSN
1000-0054
清华大学学报(自然科学版)
2011
年第
51
卷第
9
期
30/33
1303-1306
CN
11-2223/N
J
Tsinghua
Univ
(Sci
&.
Tech)
,
2011
,
Vo
l.
51
,
NO.9
多发音字典在维吾尔语方言语音识别中的应用
杨雅婷1.
2
马博1.
2
王磊
1.2
吐尔洪·吾司曼李晓
l
(1.中国科学院新疆理化技术研究所,乌鲁木齐
830011;
2
中国科学院研究生院,北京
100190)
摘
要:基于标准语音的识别系统在识别带有发音变异的
口语语料时,识别率较低。针对这一问题,提出了一种在标
准维吾尔语发音字典的基础上生成多发音字典的方法。采
用基于专家经验和数据驱动相结合的方法分析了维吾尔语
方言口音发音变异规则,构造发音变异集合,生成初始的多
发音字典,并运用了自动数据处理算法和门限闽值法,使得
能够从方言口音训练语音数据中自动获得精筒的多发音字
典。实验结果表明
2
该方法对维吾尔语方言口音的识别性
能有提升作用。
关键词:语音识别
z
多发音字典;发音变异
p
维吾尔语
中图分类号:
TP
391
文献标志码
:A
文章编号:
1000-0054(
20
11)
09-1303-04
Multi-pronunciation dictionary based Uyghur
accent modeling for speech recognition
YANG
Yating
1.
2.
MA
B01.
2.
WANG Lei
1
•
OSMAN Turghun
1
•
LI
Xiao
1
(1.
Xinjiang
Technical
Institute
of
Physics
and
Chemistry.
Chinese Academy
of
Sciences,
Urumqi
830011.
China;
2.
Graduate
University
of
Chinese Academy
of
Science,
Beijing
100190.
China)
Abstracl:
Recognition
rates
are
not
high
when
recognizing
spoken
language
with
pronunciation
variations
when
the
systems
are
based
on
the
recognition
of
the
standard
spoken
language.
This
study
presents
a
multi-pronunciation
dictionary
based
on
the
standard
dictionary.
Knowledge-based
and
data-driven
methods
are
combined
to
identify
Uyghur
dialect
pronunciation
variation
rules
to
construct
a
set
of
pronunciation
variations
and
an
initial
multi-pronunciation
dictionary.
An
automatic
data-processing
algorithm
is used
to
automatica
l1
y
generate
a
pre
口
se
multi-pronunciation
dictionary
from
a
Uyghur
accent
spoken
language
speech
corpus.
The
results
show
that
the
method
improves
the
performance
of
Uyghur
continuous
speech
recognition.
Key words:
speech
recognition;
multi-pronunciation
dictionary;
电话语音识别也正处于从实验室演示转移到实际应
用的阶段。
新疆地区有汉、维吾尔、哈萨克、蒙古、回、柯尔
克孜等
13
个主要民族,形成了以维吾尔族为少数民
族主体的多民族聚居的分布格局,造就该地区在研
究民族语音文字方面的优势。因此,该地区一些研
究院所纷纷展开了相关研究。针对现代维吾尔语语
料库系统、基于音素的维吾尔语语音合成系统、维吾
尔语连续语音识别和语音合成、维吾尔语综合语音
数据库系统建设等的研究相继展开。但是,这些研
究多以固定内容的朗读、固定模式的对话为主,灵活
性较差,对于方言口语的识别率低。
带方言口音的语音识别是目前语音识别领域研
究的一个热点,是语音识别技术实用化需要解决的
一个难题。由于不同方言地域的人带有不同方言口
音,说出的音节本身就可能不一样,对于发音变化的
比较好的解决办法是针对不同的方言训练不同的声
学模型。但是,由于语音识别系统中的语音训练数
据有限,不可能涵盖种类繁多的方言口音,从而会导
致声学模型与实际发音人不匹配问。
本文根据维吾尔语方言口音发音特点,提出了
一种在标准宇典的基础上生成多发音字典的方法。
首先根据方言口语的特点设计多发音规则,生成初
始的多发音字典,并设计了自动数据处理算法,使得
能够从方言口音训练语音数据中自动获得精简的多
发音宇典。
1
维吾尔语的方言口音
方言是民族共同语的地方变体,服从于民族共
pronunciation
variations;
Uyghur
收稿日期
2011-07-15
随着中国语音技术的发展,汉语大词汇量连续
语音识别已经达到了一个较好的识别性能,昕写机、
基金项目:中国科学院西部行动计划高新技术项目
(KGCX2-
YW-507)
作者简介
z
杨雅婷(1
985-)
.女(汉)
.新疆,博士研究生。
通信作者.李晓,研究员.
E-mail:
yangyt@ms.xjb.ac.cn