小 footprint DS-CNN 基于虚拟对抗提升的关键词检测

需积分: 12 0 下载量 59 浏览量 更新于2024-08-26 收藏 131KB PDF 举报
本文主要探讨了在语音驱动用户界面中的小足迹关键词发现(Small-Footprint Keyword Spotting, KWS)模型的改进策略,特别关注的是深度分离卷积神经网络(Depth-wise Separable Convolutional Neural Network, DS-CNN)的应用。小足迹KWS模型对于设备上运行的交互系统来说,需要具备极高的紧凑性、效率和准确性,而DS-CNN因其结构优势在满足这些需求方面表现出色。 然而,近期的研究指出,小型的KWS系统容易受到微小的对抗性扰动的影响,这可能威胁到系统的稳定性。为了提升模型的鲁棒性,作者们借鉴了虚拟对抗训练(Virtual Adversarial Training, VAT)的概念。与传统的数据增强方法不同,即通过生成特定的对抗样本来扩充训练集,本文提出了一种新的训练策略。 在虚拟对抗训练中,研究人员不直接依赖于对抗样本,而是引入了对抗性正则化。这种方法旨在使模型的决策边界更加平滑,从而提高模型在面对微小扰动时的识别能力。具体而言,他们训练DS-CNN KWS模型时,通过增加一个额外的损失项,这个损失项促使模型学习到一个稳定的决策区域,即使面对轻微的输入变化,也能保持正确的分类结果。 该研究的重要贡献在于将深度学习的理论与实际应用结合,提出了一个有效的方法来增强小型KWS模型的抗扰动性能,这对于保障语音助手等设备在实际场景中的稳定性和安全性具有重要意义。通过这种方式,DS-CNN KWS模型不仅保持了高效和准确,还提升了对潜在攻击的抵御能力,为未来在资源受限的设备上的语音识别技术提供了有价值的新思路。