HTK BOOK V3.2
第 页
- 4 -
TO t uw sp
ZERO z ia r ow sp
需要注意的是某些词比如 A 和 TO 有多种发音。 SENT-START 和 SENT-END 的实体有一
个静音模型 sil作为它们的发音,并且输出的是空符号。
3.1.3 第三步 —— 录数据
我们使用 HTK 工具 HSLab录取训练和测试数据。这是一个结合了录音和标注功能的工
具。在我们的例子里,仅使用 HSLab来录音,因为标注已经存在了。如果没有预先准备好的
训练语料(如 TIMIT 数据库中的数据),你可以使用 HSLab通过文本(上面介绍的那样)建
立它们,或者使用 HSLab 标注你的训练语料。 HSLab按如下的方式调用
HSLab noname
执行命令后, 将显示这样的窗口, 窗口上半部分是一个波形播放区域, 下半部分是一排按钮,
包括录音按钮等。如果一个文件名当作命令参数, HSLab 将播放这个文件。这里,指定的文
件名是 noname,指明了将要录新的数据。 HSLab并不给用户特别的提示, 只要录音按钮被按
下,它就将录得的数据交替地写到 noname_0,noname_1,….这些文件里,因此很容易写一个
shell脚本, 当有 noname_0之类的文件出现时, 就输出提示信息, 并按照事先约定的提示方式
重命名文件(如图 3.4所示)。
当训练语料句子的提示按上面的方法生成后,测试语料句子的提示在录音前也要生成。
工具 HSGen可以帮助我们完成测试句子提示的生成; HSGen能随机的遍历一个词网络并输出
穿越过程中遇到的每个词。例如,下面的命令
HSGen -l -n 200 wdnet dict > testprompts
将创建一个包含 200个词的测试语料,内容可能是下面这样的:
1. PHONE YOUNG
2. DIAL OH SIX SEVEN SEVEN OH ZERO
3. DIAL SEVEN NINE OH OH EIGHT SEVEN NINE NINE
4. DIAL SIX NINE SIX TWO NINE FOUR ZERO NINE EIGHT
5. CALL JULIAN ODELL
... etc
可以用它生成测试数据所需的提示文件 testprompts。
3.1.4 第四步 —— 建立标注文件