Baller-Tech ASR WebSocket API开发指南

需积分: 0 160 浏览量更新于2024-08-05 收藏 291KB PDF 举报

"语音识别（ASR）WebSocket协议WebAPI开发文档1" 本文档主要介绍了如何使用WebSocket协议来实现语音识别服务，适用于开发者希望通过轻量级、跨平台、跨开发语言的方式集成语音转文字功能。服务由Baller-Tech公司提供，其API地址为`ws://api.baller-tech.com/v1/service/ws/v1/asr`，并且要求字符编码为UTF-8，遵循WebSocket版本13(RFC6455)。接口调用流程包括三个关键步骤： 1. **计算签名并建立WebSocket连接**：使用hmac-sha256算法生成鉴权签名，然后将`host`（请求的主机名）、`date`（当前的GMT时间）和经过Base64编码的`authorization`（鉴权信息）作为参数，发送WebSocket握手请求给服务器。 2. **数据传输**：握手成功后，开发者可以通过WebSocket连接向服务器上传音频数据，同时接收识别结果。服务器会以JSON格式回应。 3. **关闭连接**：当接收到服务器推送的结束标记后，客户端应断开WebSocket连接。 **音频数据发送模式**： - **一次性发送**：适合已录制且较短的音频（通常60秒内），可以一次性发送，也可以分多次发送。 - **分次发送**：对于较长的音频或实时录音，推荐分多次发送，以便服务器能实时处理并返回识别结果。 **握手和接口鉴权**：在握手过程中，请求方需要提供签名相关参数，如`task_id`（本次任务的唯一标识）用于排查问题，以及错误信息`message`。这些参数需要URL编码后附加到请求URL后面。`date`参数用于确保请求的时间有效性，防止重放攻击。在实际应用中，开发者需要根据具体需求选择合适的音频发送模式，并正确实现握手和鉴权过程，以确保与Baller-Tech的ASR服务有效交互。通过这个WebSocket API，开发者能够灵活地构建语音识别功能，适应各种应用场景，如智能助手、语音输入系统等。

项目说明

请求地址 ws://api.baller-tech.com/v1/service/ws/v1/asr

字符编码 UTF-8

WebSocket版本 13 (RFC 6455)

响应格式统一采用JSON格式

参数类型说明示例

host string 请求的主机 api.baller-tech.com

date string 当前GMT格式的时间 Fri, 10 Jan 2020 07:31:50 GMT

authorization string 鉴权信息Base64编码后的数据 -

接口说明

语音识别（ASR）可以将语音信息转换为文字信息。该能力通过WebSocket API的方式提供给开发

者，相较于SDK，该方式具有轻量、跨平台、跨开发语言的特点。

接口要求

调用流程

1. 通过hmac-sha256计算签名，向服务器端发送WebSocket协议握手请求。

2. 握手成功之后，通过WebSocket连接上传和接收数据。

3. 请求方接收到服务器端推送的结果返回结束标记后断开WebSocket连接

音频数据发送模式

向服务器发发送音频数据时，可以一次性的将音频数据发送到的服务器，也可以将音频数据分多次

发送到服务器，不论使用那种模式向服务器发送音频数据，识别结果的推送方式是一样的，服务器会分

多次推送识别结果。两种模式的适用场景如下：

1. 已经录制好的音频且时长较短（一般60秒内）时，即可以一次性将音频数据发送到服务器，也可以

分多次发送到服务器；

2. 已经录制好的音频且时长较长时，分多次将音频数据发送到服务器；

3. 音频数据实时录取，实时识别时，分多次将音频数据发送到服务器。

握手和接口鉴权

在WebSocket的握手阶段，请求方需要对请求进行签名，服务端会根据签名检查请求的合法性。握

手时请求方将签名相关的参数经过url编码后加到请求地址的后面，具体的参数和示例如下：

ws://api.baller-tech.com/v1/service/ws/v1/asr?

authorization=xxxx&host=xxxx&date=xxx

下载后可阅读完整内容，剩余5页未读，立即下载

Jaihwoe

粉丝: 20
资源: 350

Baller-Tech ASR WebSocket API开发指南

Java WebSocket API 1.1中文版文档包下载

Spring Websocket 5.0.8中文API文档完整包下载

双语对照版websocket-common API文档及其源码包

图像识别（OCR）WebSocket协议WebAPI开发文档1

语音合成（TTS）WebSocket协议WebAPI开发文档1

机器翻译（MT）WebSocket协议WebAPI开发文档1

百度实时语音识别-websocket api

百度实时语音识别-websocket api java 调用

TCP基准测试：tcp，websocket，webapi性能测试工具

WebSocketsDemo:在AngularJS以色列聚会上使用WebSocket消费Web API的演示

最新资源