AIUI移动解决方案深度体验-Android1
在本文中,我们将深入探讨AIUI移动解决方案在Android平台的应用,特别是关注连续交互和上下文理解这两个关键特性。AIUI是科大讯飞推出的一个先进的人工智能语音交互平台,旨在提供更自然、流畅的用户体验。 我们要理解AIUI平台的业务架构。在AIUI出现之前,讯飞开放平台提供了OSP开放语义平台,服务版本为2.0,通过SDK中的SpeechUnderstander类访问。而AIUI开放平台的出现,引入了AIUI SDK,允许开发者使用AIUIAgent类来访问具有更高级功能的语义服务,特别是连续交互能力。AIUI SDK支持设置nlp_version参数为3.0,以接入AIUI的语义服务。 对于无法直接使用AIUI SDK的开发者,可以通过设置SpeechUnderstander的nlp_version为3.0和scene参数,使其能够访问AIUI的语义服务,尽管这种方式缺乏AIUI SDK的连续交互功能。在这种情况下,路径②(无连续交互、有上下文)和路径③(有连续交互、有上下文)的区别主要体现在交互形式上,而不是语义理解本身。 AIUI SDK的一大亮点是其支持的【连续交互】功能。传统的SpeechUnderstander需要用户触发识别操作(如按钮点击或唤醒词)来进行一次交互,而AIUI SDK则能在一次唤醒后持续进行多轮交互,无需再次触发,极大提升了用户体验。这种连续交互的实现依赖于SDK中的关键资源meta_vad_16k.jet,它负责判断语音片段的边界,使得SDK能准确地分割不同的话语。 此外,【上下文理解】是AIUI语义后台提供的另一重要功能,即使在非连续交互的情况下,系统也能根据前一次交互的内容理解用户的意图。例如,用户询问“合肥明天天气怎么样?”后再问“后天呢?”,AIUI能理解上下文并给出相应答案,而无需用户重复地点名城市。 为了启用AIUI SDK的连续交互,开发者需要修改配置文件aiui_phone.cfg,在speech节点下添加相关设置。这样,用户就可以进行连续提问,而无需每次交互都重新触发识别。 总结来说,AIUI移动解决方案为Android开发者提供了强大的语音交互工具,包括连续交互和上下文理解。无论是通过AIUI SDK还是通过调整普通MSC SDK,都能实现一定程度的上下文感知,但只有AIUI SDK才能提供无缝的连续对话体验。这使得AIUI成为构建智能助手和语音交互应用的理想选择,特别是在需要自然、高效人机对话的场景中。