提高精度的语音同人人脸识别方法与装置

版权申诉
0 下载量 139 浏览量 更新于2024-07-10 收藏 30KB DOCX 举报
本文档主要探讨了在人工智能飞速发展的背景下,语音识别技术在人机交互领域的广泛应用,特别是对说话人身份进行同人识别的重要性。传统的基于语音识别的同人识别方法存在精度不高、特征描述不全面等问题,因为它们往往只依赖于有限长度的语音特征进行识别,且识别过程依赖概率计算,难以达到高辨别度。 本发明针对这一技术挑战,提出了一种创新的基于语音的同人识别方法。该方法首先获取目标用户的待识别语音,然后通过标记参数信息来确定语音的格式类型和属性,如采样率、比特率和声道等。如果这些参数不符合预设标准,会进行相应的转换以确保一致性。接着,使用预设的向量机模型和特征参数对语音进行年龄识别,以确定目标用户的年龄段,并从注册用户语音数据库中找到相应年龄段的语音样本。 为了提高识别精度,本发明引入深度卷积神经网络(DCNN),将待识别语音与注册语音的数据进行分离输入,得到各自的音色特征向量。通过对这些特征向量的比对,判断目标用户与注册用户是否属于同一人。此外,该方法还强调了时域和频域特征参数的提取,这有助于更全面地描述语音的特性,从而提升同人识别的准确性。 通过这种方式,本发明不仅解决了传统语音识别方法在同人识别上的精度问题,而且采用了一种更为精细和全面的处理方式,提高了识别系统的性能,为实现更加智能化和个性化的用户体验奠定了基础。这一创新成果对于语音识别、生物识别技术和人机交互等领域具有重要的实际应用价值。
2023-06-10 上传