DNN驱动的发音偏误检测提升系统性能

194 浏览量更新于2024-08-26 收藏 759KB PDF 举报

本篇研究论文标题为"基于DNN的发音偏误趋势检测"，主要探讨的是如何利用深度神经网络(DNN)改进计算机辅助对外汉语发音训练系统。论文在第十三届全国人机语音通讯学术会议上发表，该会议于2015年10月25日至27日在天津迎宾馆召开。研究的目的是开发一个能够提供正音反馈的系统，通过前期工作中的发音偏误趋势标注体系和基于HMM的偏误趋势检测系统为基础，进一步提升系统的性能。文章的核心内容集中在采用深度神经网络进行声学建模，对比了MFCC（ Mel-frequency cepstral coefficients，梅尔频率倒谱系数）、PLP（Perceptual Linear Predictive，感知线性预测）和FBank（Filterbank）三种不同的声学特征参数。实验结果显示，DNN-HMM模型相较于GMM-HMM（Gaussian Mixture Model-Hidden Markov Model，高斯混合模型-隐马尔可夫模型）在发音偏误检测上表现出更高的准确性。三种声学特征对于不同类型的发音偏误有不同的响应，通过网格联合技术整合这些特征，系统整体性能得以优化，表现为错误拒绝率5.5%，错误接受率35.6%，检测正确率高达88.6%。论文的研究重点在于计算机辅助发音训练（CAPT）领域，特别是在发音错误检测方面，它能够提供精确的反馈，弥补了传统发音质量打分系统在纠正学习者特定偏误方面的不足。研究者关注的不仅是发音的整体评估，而是针对个体发音问题的精准识别与矫正策略，这对于提高外语学习者的口语技能具有重要意义。此外，本文还提及了资金支持，包括国家自然科学基金项目（61175019）和北京市高等学校青年英才计划（YETP0879），以及作者高迎明的个人简介和联系方式，这体现了研究者对该领域的持续投入和合作精神。这篇论文深入探讨了深度学习在语音识别和发音偏误检测中的应用，对于语音技术驱动的语言学习系统的发展具有重要价值。

第十三届全国人机语音通讯学术会议

National Conference on Man-Machine Speech Communication

NCMMSC’2015

会议指南

第十三届全国人机语音通讯学术会议组织委员会

天津·河西·天津迎宾馆 6 号楼

2015 年 10 月 25-27 日

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38621082

粉丝: 9
资源: 948

DNN驱动的发音偏误检测提升系统性能

基于传统机器学习DNN算法的恶意网站检测python源码+数据集.zip

基于传统机器学习DNN算法的恶意网站检测python源码+数据集（高分期末大作业）.zip

基于DTW算法的语音识别原理与实现.doc

声学模型的语音活动检测：精确分割语音与非语音的6个技巧

polylearn-0.1.dev0-cp35-cp35m-win32.whl.rar

基于Simulink的语音信号降噪与增强.docx

java资源Java条形码生成库 Barcode4J

pgmagick-0.7.5-cp27-cp27m-win32.whl.rar

pendulum-2.1.2-cp310-cp310-win32.whl.rar

com.bishua666.luxxx1.apk

最新资源