V11音频转写接口详解:创建与查询任务

需积分: 0 2 下载量 177 浏览量 更新于2024-08-05 收藏 104KB PDF 举报
音频文件转写接口V11是由百度提供的一项强大工具,专为大规模音频文件的实时转录而设计,适用于录音质检、会议纪要生成和内容分析等多种应用场景。该接口主要包括两个核心功能:创建音频转写任务和查询转写任务结果。 1. **创建音频转写任务接口** - **接口地址**:`https://aip.baidubce.com/rpc/2.0/aasr/v1/create` - **HTTP方法**:POST - **必需参数**: - `access_token`:通过API Key和Secret Key获取的授权令牌,确保安全访问。 - `speech_url`:音频文件的外网可访问URL,支持百度云存储。 - `format`:音频格式,如mp3、wav或pcm,单个文件大小不超过100MB。 - `pid`:语言类型ID,如1537代表中文普通话模型,1737代表英文模型。 - 可选参数:`rate`,音频采样率,默认16000Hz。 - **请求示例**: ```json { "speech_url": "http://speech-doc.gz.bcebos.com/rest-api-asr/public_audio/16k.pcm", "format": "pcm", "pid": 1537, "rate": 16000 } ``` - **返回参数**: - `log_id`:转写操作的唯一标识符。 - `task_id`:任务的标识,可能不是必需的,但可用于后续查询。 - `task_status`:任务当前状态,如"Running"表示正在进行中。 - 错误信息:如果创建失败,会包含错误码和错误消息。 2. **查询音频转写任务结果** - 这个接口用于在转写完成后获取任务的最终结果。用户需要使用之前创建任务时得到的任务ID来调用此接口。 - 返回结果可能包括转写文本、完成状态以及其他相关信息。 通过这两个接口的配合,开发者能够方便地将音频文件转换为文本,便于后续处理和分析。值得注意的是,为了确保数据安全和合规性,开发者需要妥善处理音频文件上传、访问控制和数据隐私等问题。同时,接口的使用也应遵循百度BCE的相应服务条款和API使用限制。