智能仿生双向手语翻译系统智能仿生双向手语翻译系统
设计了一套智能仿生双向手语翻译系统,该系统主要由STM32微处理器、LD3320非特定语音识别模块、
SYN6288语音合成芯片等组成,能够实现语音与手势的双向翻译。其中语音转手势部分可通过语音识别模块获
得指令,手语机器人根据指令完成语音转动作的翻译。手势转语音部分通过数据手套捕获手臂的动作和姿态,
识别手语动作,控制手语机器人发出语音。该系统具有成本低、识别度高、使用方便等优势,具有良好的应用
前景。
0 引言引言
根据第六次全国人口普查数据显示,全中国听力残疾人数为2 054万人,言语残疾人数达130万人
[1]
,他们无法像正常人一
样交流沟通,造成了工作、学习、娱乐、就医、维权等不便。他们只能通过手语相互交流,而言语正常的人中只有很少一部分
习得手语,聋哑人与普通人之间的交流变得更加困难。因此迫切需要一套智能翻译设备来帮助聋哑人与普通人进行正常的沟通
和交流。
2013年微软亚洲研究院和中科院计算所合作已经开发出了基于Kinect
1 总体结构与工作原理总体结构与工作原理
该双向手语翻译系统以
2 系统设计系统设计
2.1 硬件电路设计硬件电路设计
2.1.1 语音识别模块语音识别模块
语音识别模块硬件电路包括单片机控制部分、语音识别部分和EEROM。其中单片机控制部分选用的是STM32F103ZET6芯
片,该芯片为Cortex-M3内核,最高工作频率72 MHz,1.25DMIPS/MHz可实现单周期乘法和硬件除法,工作电压为2 V~3.6
V,同语音识别模块兼容。语音识别部分选用 LD3320 芯片作为识别芯片
[2]
,该芯片内部集成了语音识别处理器和一些外部电
路,包括AD/DA转换器、麦克风接口、声音输出接口等,不需要外接其他的辅助芯片如Flash、RAM等,直接集成在现有的产
品中即可以实现语音识别功能,而且识别的关键词语列表是可以任意动态编辑的。语音识别模块总体结构图如图2所示,其中
LD3320芯片内部的语音识别原理框图为虚线框内的部分
[3]
,供电部分采用ASM117(3.3 V,1 A)稳压器。
2.1.2 LED显示模块显示模块
LED显示模块采用64×32矩阵共阴极点阵屏,由高亮LED灯、74HC595芯片和UN2003构成。74HC595芯片具有8位移位寄
存器和一个存储器,具有速度快、功耗低的特点。74HC595作为LED矩阵的驱动器
[4]
,通过串行方式进行控制,具有电路简
单、控制方便等优点。电源部分采用LM2596稳压器,最大输出电流可达3 A。LED显示模块原理结构图如图3所示。