python语音录入转文字代码可以转文字的不要用speech——recognition库

如果不使用 `SpeechRecognition` 库，可以使用Python自带的 `pyaudio` 库录制音频，再使用百度或讯飞等语音识别API进行语音转换。以下是示例代码： ```python import wave import urllib.request import urllib.parse import json import base64 import hashlib import time import hmac import random # 配置百度AI开放平台的API信息 APP_ID = 'your_app_id' API_KEY = 'your_api_key' SECRET_KEY = 'your_secret_key' # 获取当前时间戳 def get_cur_time(): return int(time.time()) # 获取随机数 def get_random(): return random.randint(0, 100000000) # 将音频文件转换成Base64编码的字符串 def get_file_content(file_path): with open(file_path, 'rb') as f: return base64.b64encode(f.read()).decode('utf-8') # 计算签名 def get_sign(params): sign_str = '' for k in sorted(params.keys()): sign_str += '{}={}'.format(k, params[k]) sign_str += SECRET_KEY sign = hmac.new(sign_str.encode('utf-8'), digestmod=hashlib.sha256).hexdigest() return sign # 调用百度语音识别API进行语音转换 def baidu_asr(file_path): # 配置请求参数 url = 'http://vop.baidu.com/server_api' headers = { 'Content-Type': 'application/json' } audio = get_file_content(file_path) params = { 'dev_pid': '1536', # 普通话(支持简单的英文识别) 'format': 'wav', 'rate': '16000', 'channel': 1, 'cuid': 'python_asr', 'len': len(audio), 'speech': audio, 'token': '', 'mac': '', 'timestamp': get_cur_time(), 'nonce': get_random() } params['sign'] = get_sign(params) data = json.dumps(params).encode('utf-8') # 发送请求 req = urllib.request.Request(url, data=data, headers=headers) resp = urllib.request.urlopen(req) result = json.loads(resp.read().decode('utf-8')) # 解析结果 if result.get('err_no') == 0: text = result.get('result')[0] print('识别结果：{}'.format(text)) else: print('识别失败：{}'.format(result.get('err_msg'))) # 录制音频并保存为WAV格式文件 def record_audio(file_path, seconds): CHUNK = 1024 FORMAT = pyaudio.paInt16 CHANNELS = 1 RATE = 16000 p = pyaudio.PyAudio() frames = [] stream = p.open(format=FORMAT, channels=CHANNELS, rate=RATE, input=True, frames_per_buffer=CHUNK) print('*' * 10, '开始录音', '*' * 10) for i in range(0, int(RATE / CHUNK * seconds)): data = stream.read(CHUNK) frames.append(data) print('*' * 10, '结束录音', '*' * 10) stream.stop_stream() stream.close() p.terminate() wf = wave.open(file_path, 'wb') wf.setnchannels(CHANNELS) wf.setsampwidth(p.get_sample_size(FORMAT)) wf.setframerate(RATE) wf.writeframes(b''.join(frames)) wf.close() # 测试 if __name__ == '__main__': file_path = 'test.wav' record_audio(file_path, 5) baidu_asr(file_path) ``` 以上代码调用了百度语音识别API进行语音转换，需要先在百度AI开放平台注册账号，并创建语音识别应用。请将代码中的 `your_app_id`、`your_api_key`、`your_secret_key` 替换成自己的应用信息。

阅读全文

python语音录入转文字代码可以转文字的不要用speech——recognition库

相关推荐

python 声音识别，转换为文字。

语音识别转文字

C#使用微软的Speech.Recognition库实现语音识别转文字

python语音录入转文字代码能用的

python语音录入转文字代码能用的不要上面这个转不了

基于python语音识别的智能垃圾分类系统源码数据库.zip

基于python语音识别的智能垃圾分类系统源码数据库论文.doc

基于python语音识别的智能垃圾分类系统设计与实现.docx

Python语音识别驱动的智能垃圾分类系统

Python语音识别实战：从音频信号到文本信息的神奇转换

python实现语音录入功能

python中使用tkinter库做将麦克风输入的语音转成文字的gui界面，请给出示例代码

Python智能语音音频录入

python实现语音录入功能，并进行保存

写一个语音转文字模型的代码

python 语音输入

利用python在vscode实现语音识别录入文档

python爬虫语音输入

帮我用speech写一个文本转音频的代码

智慧园区3D可视化解决方案PPT(24页).pptx

大家在看

煤矿井下图像型早期火灾探测

PDK安装及cdl文件和gds文件的导入

SAP各模块字段与表的对应关系

蓝牙室内定位服务源码！

Cadence Allegro16.6高级进阶教程

最新推荐

智慧园区3D可视化解决方案PPT(24页).pptx

labelme标注的json转mask掩码图，用于分割数据集 批量转化，生成cityscapes格式的数据集

（参考GUI）MATLAB GUI漂浮物垃圾分类检测.zip

人脸识别_OpenCV_活体检测_证件照拍照_Demo_1741778955.zip

人脸识别_科大讯飞_Face_签到系统_Swface_1741770704.zip

虚拟串口软件：实现IP信号到虚拟串口的转换

【Python进阶篇】：掌握这些高级特性，让你的编程能力飞跃提升

后端调用ragflow api

IE6下实现PNG图片背景透明的技术解决方案

【欧姆龙触摸屏故障诊断全攻略】

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集