Ubuntu安装whisper-ctranslate2语音识别工具全攻略

需积分: 5 39 浏览量更新于2024-08-03 收藏 1.46MB PDF 举报

"Ubuntu下安装whisper-ctranslate2语音识别工具的详细步骤和解决常见问题的文字版教程。" 本文将详细介绍如何在Ubuntu 16.04系统上安装和使用whisper-ctranslate2，这是一个轻量级、高效的语音识别工具，基于faster-whisper和CTranslate2库。为了确保最佳性能，特别是对于配备NVIDIA Quadro RTX5000显卡的系统，推荐使用whisper-ctranslate2而非原始的whisper。一、whisper-ctranslate2介绍 whisper-ctranslate2相较于whisper，提供了更快的识别速度和更小的内存占用。其背后的CTranslate2库是一个用于Transformer模型快速推理的引擎，能够提供与whisper相同的精度，但速度提升4倍，内存消耗更低。该项目的GitHub页面提供了详细的使用说明和示例。二、准备环境 1. Python版本：至少需要3.8版本。安装Python时，确保在配置时添加`--with-openssl`参数，以避免ssl模块不可用的问题。 2. OpenSSL安装：确保系统中已安装OpenSSL，这是Python编译时需要的依赖。 3. 解决坑点：安装过程中可能遇到的错误包括缺失的Perl模块IPC/Cmd.pm、Python的_ctypes模块、证书问题等，需要分别进行安装或配置。 4. setuptools和wheel安装：这两个Python包管理工具是安装其他依赖的必备组件。 5. cuDNN安装：对于使用GPU的用户，需要安装cuDNN以加速计算。 6. pytorch/torch版本：根据whisper-ctranslate2的要求，需要安装特定版本的pytorch和torch，以支持模型运行。 7. ffmpeg安装：ffmpeg是处理音频文件的工具，用于读取和处理输入音频。 8. whisper-ctranslate2安装：通过pip安装，并根据项目文档进行配置。 - 安装whisper-ctranslate2：使用pip安装最新版本。 - 下载大模型：根据需求选择合适的预训练模型文件，将其下载到本地。 - 解决坑点：可能遇到的问题包括pkg-config找不到库、模块导入失败、维度不匹配的错误等，需按照错误提示进行排查和修复。三、使用whisper-ctranslate2 安装完成后，可以使用whisper-ctranslate2提供的命令行工具对音频文件进行识别。具体使用方法可参考官方文档或GitHub页面上的示例。四、测试对安装好的whisper-ctranslate2进行简单的测试，比如识别一个音频文件并检查识别结果的准确性。这有助于确认安装是否成功，并了解其实际性能。总结，安装whisper-ctranslate2涉及多个步骤，包括环境准备、依赖安装和问题解决。每个环节都需要细心操作，尤其是面对可能出现的坑点，要有耐心解决。对于熟悉Linux环境的用户，这个过程虽然繁琐，但通过遵循指南和解决遇到的问题，最终能成功部署并使用whisper-ctranslate2进行高效的语音识别。

这里是转文字版，也可以到我的原创vip栏参考博客。md转换格式排版有点问题，不过不影响。

环境：系统ubuntu16.04，显卡是NVIDIA Quadro RTX5000

目标：安装语音识别工具whipser/whipser-ctranslate2

因之前有过几次在linux和windows上有过部署whisper经验和使用经验，其中有使用GPU的，有

CPU的，各自语音识别效率一言难尽，建议直接装whipser-ctranslate2。同时，感谢B站博主的

（Windows系统 Whisper(OpenAI) 安装指南（全局python环境） - 哔哩哔哩）这篇文章曾给我

一些启发，有需求的小伙伴可以先参考这篇文章了解一下。

一、whipser-ctranslate2介绍 whipser-ctranslate2是相比whipser而言，识别速率更快，占

用内存空间更小的语音识别工具，GitHub使用介绍参见：

https://github.com/Softcatala/whisper-ctranslate2

faster-whisper是使用CTranslate2重新实现 OpenAI 的 Whisper 模型，CTranslate2 是

Transformer 模型的快速推理引擎。比whisper快 4 倍，但使用的内存更少，且具有相同的精度。

GitHub使用介绍参见：

https://github.com/SYSTRAN/faster-whisper

Github介绍whipser-ctranslate2是一个基于faster-whisper的命令行客户端，与openai/whisper

的原始客户端兼容。在这里只介绍一下whipser-ctranslate2的安装过程和踩坑。

二、准备环境说明：我这里没有通过conda/anaconda建立虚拟环境安装python等，是直接在系

统上安装的。两种方式各有各的优点，这里不赘述。

1. Python版本必须是3.8及以上高版本。安装过程可以参考这篇博客： https://www.chua-

n.com/2020/06/29/linux%E4%BB%8E%E6%BA%90%E7%A0%81%E5%AE%89%E8%A3

%85python/

这里不再详细介绍python安装过程，但注意执行.configure时加上参数--with-openssl指定

openssl地址和--with-ssl-default-suites指定默认ssl是openssl。例如：

./configure --prefix=/usr/local/newsoft/python3.9 --with-

openssl=/usr/local/newsoft/openssl3.2.0 --with-ssl-default-suites=openssl --with-system-

ffi

2. OpenSSL安装强烈建议在安装python前安装或升级openssl，因为后面需要python中有加载

ssl模块。去OpenSSL官网下载安装，或者参考这篇：

https://blog.csdn.net/qq_27566167/article/details/128594728

下载后可阅读完整内容，剩余6页未读，立即下载

腊八粥2022

粉丝: 36
资源: 3

Ubuntu安装whisper-ctranslate2语音识别工具全攻略

whisperx语音识别框架，语音识别文字的识别率高达百分之90以上，可作为毕业设计，下载即可运行

c语音安装包

ubuntu-python3-whisper-tornado docker镜像

Whisper-main：语音识别技术的核心突破

Python实现的Whisper-small-ct2语音识别模型下载指南

ubuntu-python3-whisper-tornado docker镜像 Dockerfile

ubuntu-python3-whisper-tornado docker镜像07

ubuntu-python3-whisper-tornado docker镜像09

whisper-take2

whisper-small-ct2 OPENAI ct2 语言识别模型实例，python环境请自行下载

最新资源