使用微软Speech SDK 5.1在MFC中开发语音识别

2星需积分: 32 95 浏览量更新于2024-11-02 2 收藏 4KB TXT 举报

"这篇文章主要介绍了如何使用微软的Speech SDK 5.1在MFC环境中开发语音识别系统。通过示例代码展示了在VC6下利用Speech API 5.1进行语音识别的主要步骤，包括COM初始化、预处理器定义、选择识别器模式、设置输入设备以及创建识别上下文，并设置通知消息来接收识别结果。" 在使用微软的Speech SDK 5.1开发语音识别系统时，首先要确保你的开发环境是MFC，并且你有Visual C++ 6.0（VC6）这样的编译器。以下是利用Speech SDK 5.1在MFC中进行语音识别开发的关键步骤： 1. **初始化COM组件**：在程序启动时，你需要初始化COM组件。这可以通过调用`CoInitializeEx()`函数实现，例如`::CoInitializeEx(NULL, COINIT_APARTMENTTHREADED);`。这里选择了`COINIT_APARTMENTTHREADED`模式，它适合MFC应用程序。 2. **预处理器定义**：为了使SDK正常工作，需要在项目设置中调整预处理器定义。在“Category”选项中选择“Preprocessor”，然后在“Preprocessor definitions”中添加`_WIN32_DCOM`，确保SDK可以正确通信。 3. **选择识别器模式**：Speech SDK 5.1提供了两种识别器模式，即“Shared”和“InProc”。`Shared`模式允许多个进程共享同一个识别引擎，而`InProc`模式则在当前进程中创建识别器。例如，你可以使用`CoCreateInstance()`函数创建这两种类型的识别器。 4. **设置输入设备**：获取默认的音频输入设备令牌，通常用于语音识别。可以使用`SpGetDefaultTokenFromCategoryId(SPCAT_AUDIOIN, &cpAudioToken);`来获取。然后将这个令牌传递给`ISpRecognizer::SetInput()`方法，设置识别器的输入源。 5. **创建音频对象**：创建一个默认的音频输入对象，通过`SpCreateDefaultObjectFromCategoryId(SPCAT_AUDIOIN, &cpAudio);`。接着，将这个音频对象作为输入源设置到识别引擎`ISpRecoEngine`，通过`SetInput()`方法。 6. **创建识别上下文**：识别上下文是处理语音识别事件的核心组件。调用`ISpRecognizer::CreateRecoContext()`方法创建一个`ISpRecoContext`对象，如`hr=m_cpRecoEngine->CreateRecoContext(&m_cpRecoCtxt);`。 7. **设置通知机制**：为了接收到识别结果，需要设置一个窗口消息通知机制。调用`ISpRecoContext::SetNotifyWindowMessage()`方法，将识别事件绑定到特定的窗口消息，如`WM_R`，这样当有新的识别结果时，应用程序会接收到消息。 8. **处理识别事件**：在MFC应用中，你需要为`WM_R`消息编写处理函数，从`ISpRecoContext`对象中获取识别结果并进行相应操作。以上就是使用微软Speech SDK 5.1在MFC中开发语音识别系统的基本流程。在实际开发过程中，还需要考虑错误处理、语音识别的配置、语法和词汇管理，以及用户交互等其他方面，以构建一个完整的语音识别应用程序。

利用微软Speech SDK 5.1开发语音识别系统主要步骤

利用微软Speech SDK 5.1在MFC中进行语音识别开发时的主要步骤，以Speech API 5.1+VC6为例：

1、初始化COM端口
一般在CWinApp的子类中，调用CoInitializeEx函数进行COM初始化，代码如下：
::CoInitializeEx(NULL,COINIT_APARTMENTTHREADED); // 初始化COM
注意：调用这个函数时，要在工程设置（project settings）->C/C++标签,Category中选Preprocessor，在Preprocessor definitions:下的文本框中加上“,_WIN32_DCOM”。否则编译不能通过。

2、创建识别引擎
微软Speech SDK 5.1 支持两种模式的：共享（Share）和独享（InProc）。一般情况下可以使用共享型，大的服务型程序使用InProc。如下：
hr = m_cpRecognizer.CoCreateInstance(CLSID_SpSharedRecognizer);//Share
hr = m_cpRecognizer.CoCreateInstance(CLSID_SpInprocRecognizer);//InProc
如果是Share型，可直接进到步骤3；如果是InProc型，必须使用 ISpRecognizer::SetInput 设置语音输入。如下：
CComPtr<ISpObjectToken> cpAudioToken; //定义一个token
hr = SpGetDefaultTokenFromCategoryId(SPCAT_AUDIOIN, &cpAudioToken); //建立默认的音频输入对象
if (SUCCEEDED(hr)) { hr = m_cpRecognizer->SetInput(cpAudioToken, TRUE);}
或者：
CComPtr<ISpAudio> cpAudio; //定义一个音频对象
hr = SpCreateDefaultObjectFromCategoryId(SPCAT_AUDIOIN, &cpAudio);//建立默认的音频输入对象
hr = m_cpRecoEngine->SetInput(cpAudio, TRUE);//设置识别引擎输入源

3、创建识别上下文接口
调用 ISpRecognizer::CreateRecoContext 创建识别上下文接口（ISpRecoContext），如下：
hr = m_cpRecoEngine->CreateRecoContext( &m_cpRecoCtxt );

4、设置识别消息
调用 SetNotifyWindowMessage 告诉Windows哪个是我们的识别消息，需要进行处理。如下：

下载后可阅读完整内容，剩余3页未读，立即下载

gumprun1314

粉丝: 0
资源: 1

使用微软Speech SDK 5.1在MFC中开发语音识别

Microsoft Speech SDK安装包及博客教程教程（语音识别）

java实现语音功能 调用speech.dll

SpeechSDK Demo微软语音识别演示（中文和日文）

微软SpeechSDK5.1开发语音识别系统主要步骤.pdf

微软Speech SDK 5.1开发语音识别系统的主要步骤

微软SpeechSDK 5.1语音识别系统开发步骤详解

利用微软Speech SDK 5.1在MFC中进行语音识别介绍

Speech SDK 5.1开发主要步骤

VB_speech SDK 5.1语音识别

微软SpeechSDK5.1语音识别开发教程

最新资源

java实现语音功能调用speech.dll