没有合适的资源?快使用搜索试试~ 我知道了~
首页kaldi的全部资料_v0.7(未完成版本).pdf
资源详情
资源评论
资源推荐
kaldi
资料归纳和总结
wbglearn
(吴本谷)
version 0.7
2016
年
9
月
5
日
目录
目录......................................................................................................................................2
0 开篇前的话......................................................................................................................4
1 kaldi 的介绍......................................................................................................................5
1.1 kaldi 简介...............................................................................................................5
1.2 kaldi 的特色...........................................................................................................5
1.3 kaldi 的声学模型...................................................................................................5
1.4 kaldi 所用到的库介绍:..........................................................................................5
2 kaldi 的安装和出现错误的解决方案..............................................................................6
2.1 安装前的配置........................................................................................................6
2.2 安装........................................................................................................................6
2.2.1 Unbunt.........................................................................................................6
2.2.2 Cygwin........................................................................................................ 6
2.2.3 服务器或者工作站.....................................................................................7
3 kaldi 的使用......................................................................................................................8
3.1 总述........................................................................................................................8
3.2 kaldi 里各种数据库的介绍.................................................................................15
3.3 yesno 的例子....................................................................................................... 16
3.4 timit...................................................................................................................... 16
3.5 rm......................................................................................................................... 16
3.6 voxforge............................................................................................................... 17
3.7 kaldi 上使用 GPU 以及如何安装 cuda.............................................................. 17
3.8 可以使用的公开数据库......................................................................................19
3.9 如何使用自己的数据集......................................................................................19
3.10 kaldi 上第一个中文数据库...............................................................................20
3.11 对各位语音识别新手的建议............................................................................20
3.12 如何使用 kaldi 工具包使用小数字语料库创建一个简单的 ASR 系统........ 23
4 kaldi 主页上的翻译........................................................................................................34
4.1 数据准备..............................................................................................................35
4.2 特征提取..............................................................................................................51
4.3 声学建模代码......................................................................................................53
4.4 kaldi 里解码图的构建.........................................................................................55
4.5 Karel 的深度神经网络训练实现........................................................................59
4.6 Kaldi 中的关键词搜索........................................................................................63
4.8 在线识别..............................................................................................................75
4.9 决策树是如何在 kaldi 中使用............................................................................79
4.10 Decision tree internals........................................................................................88
4.11 HMM 拓扑结构和转移模型............................................................................92
4.12 kaldi 里的聚类机制.........................................................................................100
4.13 Decoding-graph creation recipe (training time)...............................................102
4.14 Decoding-graph creation recipe (test time)......................................................104
4.15 kaldi tutorial..................................................................................................... 112
5 附录..............................................................................................................................136
5.1 kaldi 上搭建 TIMIT 基线系统..........................................................................136
5.2 kaldi
里的
voxforge........................................................................................... 139
5.3
在
vs 2013
中编译
kaldi.................................................................................... 144
5.4 kaldi
学习联盟群第一次讨论记录
...................................................................145
6
其他资料和资源
..........................................................................................................153
7
版本更新日志
..............................................................................................................154
0
开篇前的话
首先,先打 2 个广告。希望大家看到文档的同时,可以积极参与讨论。
第一个广告:kaldi 学习 语音深度学习群,群号是:367623211。欢迎大家的
加入。
第二个广告:语音识别论坛,论坛地址:
http://www.threedweb.cn/forum-76-1.html 论坛欢迎大家的发帖和跟帖,欢迎大家
积极讨论。
其次,关注我博客(http://blog.csdn.net/wbgxx333)的人应该知道本文档是建
立在群里大家的共同努力完成的,特别是对 kaldi 主页翻译的部分,感谢每个参
与翻译的人,感谢你们的辛勤劳动和付出,希望可以对学习 kaldi 的人有用。
最后,希望大家可以积极参与讨论,让群和论坛全部活跃起来,也可以使语
音识别逐渐成为大家的生活的一部分。
备注:此文档不定期更新,如果您发现有任何问题和疑问,欢迎随时在群里
跟我联系或者通过邮箱(wbglearn@gmail.com 或者 354475072@qq.com)与我联
系,我们将逐渐完善该文档。
2014.8.16
最近都在对 kaldi 的脚本和源码有兴趣,欢迎大家积极交流。大家的看的时候
希望做下笔记,然后写下你自己的理解,希望你可以发给我,我将放在我们这里,
供大家学习,希望越多的人加入进来,为未来的人铺好路。此外,大家在学习
kaldi 的过程一定要注重对代码和脚本的学习,学的深一点,不要仅仅会运行。
祝大家学习愉快!
2016.9.8
Kaldi 新手群:279295537。欢迎各位新手加入。Kaldi 学习群现在人员满了,
需要回答问题才能入群。
1 kaldi
的介绍
1.1 kaldi 简介
kaldi是一个开源的语音识别工具箱,是基于c++编写的,可以在windows和unix
平台上编译。
1.2 kaldi 的特色
与文本无关的LVCSR系统;
基于FST的训练和解码;
最大似然训练;
各种各样的线性和映射变换;
有VTLN,SAT的脚本;
1.3 kaldi
的声学模型
支持标准的机器学习训练模型:
线性变换如:
LDA HLDA,MLLT/STC
;
说话人自适应
:fMLLR,MLLR
;
支持
GMM,SGMMs,DNN
1.4 kaldi 所用到的库介绍:
1.OpenFst:Weighted Finite State Transducer library (加权有限状态转换器)
2.ATLAS/CLAPACK:标准的线性代数库
3.sph2pipe:由 sph 文件转成其他音频文件
4.srilm:语言模型的工具箱
5.sctk:score benchmark(评价 ASR 基准)
剩余153页未读,继续阅读
u010347179
- 粉丝: 1
- 资源: 9
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- 数据结构1800题含完整答案详解.doc
- 医疗企业薪酬系统设计与管理方案.pptx
- 界面与表面技术界面理论与表面技术要点PPT学习教案.pptx
- Java集合排序及java集合类详解(Collection、List、Map、Set)讲解.pdf
- 网页浏览器的开发 (2).pdf
- 路由器原理与设计讲稿6-交换网络.pptx
- 火电厂锅炉过热汽温控制系统设计.doc
- 企业识别CIS系统手册[收集].pdf
- 物业管理基础知识.pptx
- 第4章财务预测.pptx
- 《集成电路工艺设计及器件特性分析》——实验教学计算机仿真系.pptx
- 局域网内共享文件提示没有访问权限的问题借鉴.pdf
- 第5章网络营销策略.pptx
- 固井质量测井原理PPT教案.pptx
- 毕业实习总结6篇.doc
- UGNX建模基础篇草图模块PPT学习教案.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0