4.
识别系统需完成的任务
在语音打字机这一类任务中,要求识别系统正确无误的将口述语言逐词逐
句的转化为书面文字。在问询、查寻和控制系统中,只需要对用户的要求做出
正确响应,而用户在说话中常带有的语气诃和一些不必要的添加话语可以被忽
略.识别系统只需识别关键的词条即可,这称为关键词确认技术。更深一层的
识别则需要了解话语的语义信息和语用信息,这不但对于进一步处理(例如翻
译)是必要的,而且对改善识别效果也是很有用的。但是这已涉及到自然语言
处理的研究范畴。
5.语言的质量
这包括说话时背景噪声的强度以及说话者讲话的清楚程度这两个方面。当
识别系统在安静的环境中工作时可以得到较好的效果,但是有的环境中存在着
强噪声,或者存在多人同时说话的嘈杂环境,识别系统也必须能适应这种情况。
说话者的话语质量取决于本人口齿是否清楚,也取决于是否采取合作的态度,
这往往不是识别系统能控制的。
6.
应用领域的宽窄和句法的约束程度
如果识别系统应用在一个特定领域,这样不但词汇表容易得到控制,而且
遣词造旬等句法约束也比较严格。如能充分利用这些约束条件就可以得到较好
的识别效果。相反,如应用领域很宽,句法约束的限制条件不严格,甚至出现
不符合句法和不完备的句子,则识别就困难得多。
二、语音识别所面临的困难
1.
由于词汇表的扩大和由孤立词语音转化为连续语音而引起的困难:
口述语言中最基本的组成单位是音素或称为音子,由音子可以组成半音节
和音节,由后者构成词,由词构成短语和句。对于小词汇表、孤立词识别系统,
可以选择词、词组、短语甚至整个句子作为识别单位,也就是词汇表中的词条。
在模板库中为每个词条建立一个模板。但是随着系统中用词量的提高,以整个
句子或短语作为识别单位显然是不可能的,如果这样做,词条的数目将达到天
文数字。以词作为识别单位或选择次词单位——例如音节、音素等作为识别单
位各有优缺点。一方面希望所选识别单位的数量尽可能少,因为越少就越有利
于识别时减少搜索的范围。另一方面,希望所选识别单位嵌在不同的上下文中
时其变化越小越好。这两方面的要求是相互矛盾的。如果选择音子作为识别单
位,无论是英语还是汉语中可区分的音子数都不超过60个,因此可以满足第一
评论0