vosk-browser：实现跨浏览器语音识别的新型库

需积分: 24 165 浏览量更新于2024-11-22 收藏 482.79MB ZIP 举报

资源摘要信息:"Vosk-browser是一个基于Vosk语音识别引擎的WebAssembly版本，它允许开发者在浏览器中实现高效的语音识别功能。Vosk本身是一个开源的语音识别工具包，它支持多种语言，并且性能良好。而Vosk-browser的出现，使得开发者可以更加便捷地在Web项目中集成语音识别功能。首先，了解WebAssembly是十分必要的。WebAssembly是一种新的代码格式，它能够在现代浏览器中运行高效的、接近原生速度的代码，而不需要对现有的网络基础设施做出改变。它不仅可以在浏览器中运行，还能在服务器端运行，比如NodeJS环境。通过WebAssembly，可以将C++、Rust等语言编写的程序编译成可以在浏览器中执行的形式，使得这些程序能够运行得更快。 Vosk-browser正是这样一个通过WebAssembly技术构建的浏览器库，它封装了Vosk引擎，使得其功能能够在浏览器中使用。开发者可以利用这个库来实现语音输入的实时识别，或者对已有的音频文件进行语音转文本的操作。在安装方面，Vosk-browser支持npm这样的包管理工具，允许开发者通过简单的命令行安装，方便集成到现有的NodeJS项目中。此外，也支持通过CDN直接引入库文件到HTML页面中，通过全局变量Vosk访问。该库支持多种语言的语音识别，演示页面中展示了13种不同语言的实时语音识别，这些演示包括了浏览器麦克风输入以及上传的音频文件的识别。从技术的角度来看，Vosk-browser的WebAssembly构建为前端开发者提供了一个非常有用的工具，因为传统的语音识别通常需要后端服务的支持，或者依赖于某些特定的浏览器插件。而WebAssembly的实现，使得前端可以直接处理复杂的音频数据，进行实时处理，并将结果以文本形式展示，这大大提高了用户体验，并减少了对服务器的依赖。 Vosk-browser库的标签包括了typescript、webassembly、wasm、speech-recognition、speech-to-text、kaldi、stt、asr、vosk、JavaScript等，这显示了它丰富的功能和用途。其中，'typescript'意味着开发者可以使用强类型的语法来开发更加健壮的代码；'webassembly'、'wasm'明确了库的底层技术；'speech-recognition'和'speech-to-text'是库的主要功能，即语音识别和语音转文本；'kaldi'表示Vosk-browser可能集成了Kaldi语音识别工具的功能；'stt'和'asr'分别是语音转文本的缩写，指代的是同样的技术；而'vosk'则直接指向了原始的Vosk语音识别引擎。综上所述，Vosk-browser为前端开发者提供了一个强大的工具，通过WebAssembly技术将Vosk语音识别引擎的复杂计算能力引入到了浏览器端，极大地扩展了Web应用的可能性，并使得在浏览器中实现高效的语音识别变得更加方便快捷。"

资源目录

收起资源包目录

vosk-browser：实现跨浏览器语音识别的新型库（76个子文件）

vosk-model-small-en-in-0.4.tar.gz 35.82MB

interfaces.ts 2KB

vosk.post.js 6KB

CLAPACK-WA.patch 1KB

vosk-model-small-fr-pguyot-0.3.tar.gz 43.87MB

vosk-wasm.js 3.81MB

index.css 246B

index.css 207B

package.json 1KB

NOTICE 411B

robots.txt 67B

worker.ts 6KB

.gitmodules 80B

vosk-model-small-tr-0.3.tar.gz 35.14MB

tsconfig.json 668B

tsconfig.json 6KB

vosk-model-small-pt-0.3.tar.gz 30.94MB

vosk-model-small-ru-0.4.tar.gz 38.92MB

index.js 1KB

VoskJS.js 19KB

index.html 702B

web-worker.d.ts 107B

Makefile 3KB

vosk-model-small-fa-0.4.tar.gz 46.48MB

vosk.d.ts 878B

model-loader.tsx 2KB

microphone-stream.d.ts 36B

vosk-model-small-en-us-0.15.tar.gz 39.28MB

README.md 2KB

.gitignore 310B

model.ts 4KB

favicon.ico 120KB

utils.h 308B

kaldi.patch 50KB

bindings.cc 3KB

react-app-env.d.ts 40B

COPYING 10KB

vosk-model-small-vn-0.3.tar.gz 32.11MB

.gitignore 11B

Dockerfile 2KB

file-upload.tsx 2KB

index.js 2KB

README.md 6KB

vosk-wasm.d.ts 878B

NOTICE 134B

vosk-model-small-it-0.4.tar.gz 32.67MB

recognizer.tsx 3KB

audiostreamer.ts 489B

vosk.pre.js 997B

README.md 3KB

vosk-model-small-es-0.3.tar.gz 32.86MB

.gitignore 12B

microphone.tsx 2KB

.gitignore 12B

package.json 1KB

audiobucket.ts 204B

utils.cc 5KB

package-lock.json 761KB

vosk-model-small-cn-0.3.tar.gz 31.7MB

.npmignore 79B

vosk.ts 25B

COPYING 10KB

index.html 602B

package-lock.json 60KB

index.css 401B

vosk-model-small-ca-0.4.tar.gz 41.35MB

index.html 411B

logo512.png 22KB

index.html 743B

Makefile 372B

manifest.json 508B

rollup.config.js 621B

.gitignore 17B

logo192.png 7KB

vosk-model-small-de-0.15.tar.gz 44.32MB

index.tsx 1KB

共 76 条

CyberStar

粉丝: 43
资源: 4685

vosk-browser：实现跨浏览器语音识别的新型库

vosk-server:基于Vosk和Kaldi库的WebSocket，gRPC和WebRTC语音识别服务器

vosk:VOSK语音识别工具包

javascript多浏览器语音播报，文字转语音

vosk-android-demo:具有Vosk库的Android离线语音识别

vosk-api：离线语音识别API，适用于Android，iOS，Raspberry Pi和具有Python，Java，C＃和Node的服务器

语音识别-vosk-中文识别模型

基于Jupyter Notebook平台的vosk-api深度学习语音识别设计源码

vosk-unity-asr-master.zip

Python库 | vosk-0.3.6-cp37-cp37m-linux_armv6l.whl

Python库 | vosk-0.3.6-cp36-cp36m-manylinux2010_x86_64.whl

最新资源