自激励通信代理推动现实世界视觉对话导航
36 浏览量
更新于2025-01-16
收藏 1.06MB PDF 举报
本文主要探讨了现实世界视觉对话导航(Visual Dialogue Navigation, VDN)中的新型自激励通信代理(Self-Incentivized Communication Agent, SCoA)。传统的VND方法依赖于预定义位置的对话,这在实际应用中存在局限性,因为它们依赖于昂贵的对话注释,且限制了人与机器人的自然交流和协作。为了解决这个问题,研究者提出了SCoA,这是一种能够自主决定何时以及如何与人类进行沟通,从而获取引导信息的系统。
SCoA的核心创新包括两个关键组件:一是“是否要问”(WeTA)策略,它允许代理判断在特定情境下是否需要提问,这有助于节省不必要的交互;二是“问什么”(WaTA)策略,通过学习预测答案,代理能够挑选出最有利于导航的问题,同时模仿人类的回答,增强了在未知或难以察觉环境中的导航能力。这种方法不再受限于预先设定的对话场景,而是能够灵活地适应现实世界的交互。
论文通过在一个统一的模仿学习和强化学习框架中协同优化通信和导航,展示了SCoA在可见和不可见环境中的实际效果。实验结果显示,相比于没有对话注释的现有基准,SCoA表现更优,即使在人类协助不可用的情况下,也能通过自我问答的方式有效地引导导航,降低了通信成本。与基于丰富对话注释的模型相比,SCoA展现出具有竞争力的性能。
本文的工作革新了视觉对话导航领域的通信机制,为实现更加自然、高效的机器人与人类互动的导航系统提供了新的可能,对于推动人机交互技术的发展具有重要意义。
3121 浏览量
2024-11-21 上传
2022-05-11 上传
点击了解资源详情
点击了解资源详情
2025-03-06 上传
2025-03-06 上传
2025-03-06 上传

cpongm
- 粉丝: 6
最新资源
- 全面详实的大学生电工实习报告汇总
- 利用极光推送实现App间的消息传递
- 基于JavaScript的节点天气网站开发教程
- 三星贴片机1+1SMT制程方案详细介绍
- PCA与SVM结合的机器学习分类方法
- 钱能版C++课后习题完整答案解析
- 拼音检索ListView:实现快速拼音排序功能
- 手机mp3音量提升神器:mp3Trim使用指南
- 《自动控制原理第二版》习题答案解析
- 广西移动数据库脚本文件详解
- 谭浩强C语言与C++教材PDF版下载
- 汽车电器及电子技术实验操作手册下载
- 2008通信定额概预算教程:快速入门指南
- 流行的表情打分评论特效:实现QQ风格互动
- 使用Winform实现GDI+图像处理与鼠标交互
- Python环境配置教程:安装Tkinter和TTk