python语音识别代码_python实现百度语音识别api
时间: 2024-06-08 08:07:11 浏览: 145
以下是使用Python实现百度语音识别API的代码:
```python
import requests
import json
# 设置API_KEY和SECRET_KEY
API_KEY = 'your_api_key'
SECRET_KEY = 'your_secret_key'
# 设置参数
url = 'http://vop.baidu.com/server_api'
headers = {
'Content-Type': 'application/json',
}
params = {
'format': 'pcm',
'rate': 16000,
'channel': 1,
'cuid': '123456PYTHON',
'token': '',
'lan': 'zh',
'speech': '',
'len': 0,
}
# 获取access_token
auth_url = 'https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + API_KEY + '&client_secret=' + SECRET_KEY
response = requests.post(auth_url)
access_token = json.loads(response.text)['access_token']
params['token'] = access_token
# 读取本地录音文件
with open('record.pcm', 'rb') as f:
speech = f.read()
params['speech'] = base64.b64encode(speech).decode('utf-8')
params['len'] = len(speech)
# 发送请求
response = requests.post(url, headers=headers, data=json.dumps(params))
result = json.loads(response.text)['result'][0]
# 输出识别结果
print(result)
```
在此代码中,我们首先设置了API_KEY和SECRET_KEY,然后设置了参数,包括音频格式、采样率、录音通道数、用户标识符、语言等。然后我们使用API_KEY和SECRET_KEY获取了access_token,并将音频文件转换为base64编码格式,将参数和音频文件发送到百度语音识别API,最后输出识别结果。
需要注意的是,这里使用的是百度语音识别API的“在线版”,即需要将音频文件发送到API服务器进行识别。如果需要使用“离线版”,需要先下载相应的语音模型到本地,然后使用相应的SDK进行本地识别。
阅读全文