没有合适的资源?快使用搜索试试~ 我知道了~
语言游戏中复杂性增长的主动控制威廉·舒勒引用此版本:威廉·舒勒主动控制语言游戏的复杂性增长。Multiagent Systems [cs.MA].波尔多大学,2018年。英语NNT:2018BORD0382。电话:01966815v3HAL Id:tel-01966815https://theses.hal.science/tel-01966815v32019年3月20日提交HAL是一个多学科的开放获取档案馆,用于存放和传播科学研究文件,无论它们是否已这些文件可能来自法国或国外的教学和研究机构,或来自公共或私人研究中心。L’archive ouverte pluridisciplinaireTHERISSE PRESENTÉEPOUR OBTENIR LE GRADE DE波尔多大学博士数学与信息学博士专业:信息威廉·舒勒语言游戏导演:Pierre-Yves Oudeyer支持日期:2018年12月10日陪审团成员:Bart de Boer陪审团主席/特别报告员Kenny Smith特别报告员Dan Dediu考官Andrea Baronchelli维托里奥·洛雷托·因维特Pierre-YvesOudeyer2W我会我会徐慧玲致谢其他语言的致谢(法语-土耳其语-加泰罗尼亚语-意大利语-西班牙语部分)可以在此仅限英语版本之后找到。我首先要感谢陪审团的成员,这是一个荣幸,有你们大家阅读我的作品并为我辩护你的工作一直是一个灵感,并与你和你的许多学生在各种会议和活动的聊天。感谢Kerem把我介绍给这些学生中的许多人,感谢Ramon不仅首先把我带到Evolang社区,而且激励我在做castells的同时学习加泰罗尼亚我要感谢我的主管Pierre-Yves Oudeyer,没有他,这项工作就不可能完成。他教我瞄准可行的目标,把完美放在一边,因为– 正如另一个人法比安·贝努罗(Fabien Benureau)所说,他带来了令人难以置信的帮助和指导– 最优的我感谢弗劳尔斯团队的所有成员,感谢我与他们分享的时间,特别是本杰明这个写作伙伴,巴蒂斯特这个欣赏我双关语的人,弗洛这个自动售货机黑客,迪迪埃这个快乐的扬声器,亚历山德拉这个坚韧的榜样,海伦这个激励教练,阿德里安这个诚实的火箭联赛评论员,最后但并非最不重要的是西奥,一个精通一切的专家许多其他人在Inria也发挥了重要作用,在这篇论文。感谢法比安、泽维尔、巴尔加夫、菲利普、索尔(在防守前两天有效地救了我)、皮埃尔·安托万、乔纳森、亚历克斯·斯普里特(在截止日期前在纽约接待了我)、玛丽、辛西娅。当然,我需要提到马克·富恩特斯,我可以和他分享我对双关语和语言的热爱。特别要感谢Sandy和Mendal,是他们使我们能够构建第二个版本的实验。感谢行政助理,尤其是卢斯和尼古拉斯,他们似乎有神奇的文书工作技能。我在罗马的逗留对我重新关注论文非常有帮助,我非常感谢Vittorio给我在Sapienza工作半年的机会,以及我们进行的有效讨论。当然,我需要感谢米格尔的耐心,慢慢地把我的西班牙语撕成一个功能性的意大利语,以及他的日常聊天。我还要感谢Pietro,他痛苦地听到了我的第一个意大利双关语,感谢Betta这个帮了我很多忙的书呆子,感谢Vito和Bernardo,我最近才在这里见到他们。这次在罗马的住宿也是一个伟大的时间感谢我的朋友,弗拉',米歇尔,保拉,埃斯特尔,雷切尔,Maghetto,维耶里,玛丽卡,和许多其他人。我希望看到所有很快去吃一些感谢我所有的朋友;德丝蕾负责城堡的园艺工作,燕负责滑翔伞露营派对,布鲁诺在我入住之初接待了我,奥利维尔每次都从另一个国家出现,托马斯进行了有益的讨论,田汉、文森特和卢卡斯给予了很大的 帮助。感谢所有帮助我的朋友们,让我不用忘记我的土耳其语!Dilh和O guz作为同事,Dilan,Gisèle,Éleonore,Günay和其他人在波尔多,Dilh,Toprak,Özge他们的访问,当然玛丽-克里斯汀,阿里和SzöpSzöi感谢他们的热情好客,每次我会回到伊斯坦布尔;和我的许多朋友,尼科,米娜,Didem,Ilyas,Ruhi,让-米,马加利,和所有在GSU的同事。感谢我的奶奶,她无条件的爱和许多盒子的库格霍夫,普雷特拉和杜松子酒填充巧克力!感谢我的妈妈和我的堂兄弟姐妹们的支持和理解我稀疏的存在和糟糕的组织在过去几年。感谢我的堂兄文森特在我很小的时候就把我介绍给了研究世界当然,如果没有我的许多室友(在博士课程中超过20个),尤其是劳拉,Noémie,Zazoo,Isa,这一切都是不可能的。在博士期间,Seb和Leana是不变的,他们成为了我眼中的家人;还有Jad,他不幸地离开了法国,我们想念你!最后但并非最不重要的是,感谢亚历克斯和波琳的友谊和支持,我从你们身上学到了很多,我期待着参加你们自己的辩护!雷默西芒我开始向陪审团成员表示感谢,因为你们很荣幸能来这里为我们辩护。Votre travail a étéune inspiration,ainsi que les discussions avecvous et vos nombreux étudiants au cours desdifférents évènements et conféciliqui ont ponctuésmathèse. 是的,我很高兴你能在我面前表现得很好。感谢拉蒙把我介绍到谢谢我的导演皮埃尔-伊夫·奥德耶,如果没有工作就不可能。 他– 作为一个助手和指导,法比安·贝纽罗-感谢弗劳尔斯的所有成员,特别是作家班杰明,喜欢我的格言的巴蒂斯特,自动黑客弗洛,快乐的上帕夏,技术模特亚历山德拉,教练激励海伦,火箭联盟的荣誉教练阿德里安,以及最后的泰奥,一个完全吸引人的专家在这一过程中,因里亚的其他人也扮演着重要的角色。感谢Fabien、Bhargav、Philippe、Sol(今天我在这里)、Pierre-Antoine、Jonathan、Damien、Alex Spriet(我刚在一个截止日期前来到纽约)、Marie、Cynthia。马克,我希望你能在欧洲讲一些谚语特别感谢桑迪和他的朋友们,他们可能会把两个版本的经验放在一起感谢行政助理和助手,特别是卢斯和尼古拉斯,他们似乎是官僚机构的魔法师。我在罗马的经历让我觉得这很有意义,维托里奥给了我很多机会,让我可以在智慧中学习,也可以在有意义的讨论中学习我的朋友米格尔因你的缘故,用意大利语把我的城堡换了,又因你的缘故,在一年中与我交谈。谢谢彼得罗,我在意大利的时候没有那么容易就能找到我的第一个朋友,谢谢贝塔,我的书呆子,维托和贝尔娜,他们在罗马的时候没有那么多我非常感谢罗马的所有朋友,弗拉,米歇尔,保拉,埃斯特尔,拉结,马盖托,维埃里,玛丽卡,以及其他许多人快点把我的车开走感谢所有的朋友:德丝蕾为城堡的花园举办了讲座,严为晚会提供了降落伞,布鲁诺为我带来了波尔多的演出,奥利维尔为我带来了来自其他国家的演出,托马斯为我带来了一些有用的讨论,田汉,文森特和卢卡斯为我提供了一些机会但你要知道这是一个很好的选择!OgZuz是一个很好的朋友;Dilan,Gisèle,Éleonor e,Güna yveba southkaarkadasboutharbordoarkada 的评 论 :Nico, Mina , Didem , Il y as , Ruhi , Olc ay, Jean-Mi , Magali , FredveGSénde isoughtakadasoughtakadar.谢谢妈妈对你的爱和热情,也谢谢你对我的爱巧克力饼干,糖果还有杜松子酒巧克力!我很感激我的母亲和我的堂兄弟们,希望他们能支持和理解我在最后时刻的失败,我的堂兄弟文森特也希望我能去研究界当然,如果没有我的助手和支持(加上20天的支持),尤其是劳拉、诺米、扎祖和伊萨,这是不可能的这些年来,塞布和勒纳一直保持着不变的生活条件,这是一种新的家庭生活方式;没有了杰德,法国人在我离开法国之前就开始了错误的生活方式。感谢亚历克斯和宝琳对你们的支持你们的友谊以及你们对我的所有评价。现在我要去看你们的巡回演出!(Leana,你也要这样做!)摘要关键词:主动学习-领域,例如感觉运动技能。第一批定义惯例的人只是在几个选项中任意选择了一个:路边开车,设计一个电插头,或者发明一个新词。正因为如此,当在一群相互作用的个体中设定一个新的惯例时,可能会出现许多竞争性的选择,如果出现许多平行的发明,就会导致越来越复杂的情况我们如何处理这个问题?人类经常主动控制他们的学习情况,例如选择既不太复杂也不太简单的活动。在感觉运动学习等情况下,这种行为已被证明有助于更快,更好地学习,并且使用更少的示例。这种机制是否也能对社会公约的谈判产生影响?社会惯例的一个特别例子是词汇:我们将哪些词与给定的含义联系起来。语言出现的计算模型,称为语言游戏,表明一群智能体可以通过成对的交互来建立一种共同的语言特别是,该模型侧重于词汇映射单词和含义的形成,并在开始丢弃选项并找到最终共识之前显示出典型的复杂性爆发。在这篇论文中,我们引入了主动学习和主动控制复杂性增长的思想,在一个主题选择策略的形式:代理可以选择他们想要谈论的意义在每次互动。引入了几种策略,它们对收敛到共识所需的时间和个体代理所需的内存量都有不同的影响。首先,我们人为地限制记忆的代理,以避免局部复杂性爆发。 提出了一些策略,其中一些可以有类似的收敛速度在标准情况下。其次,我们形式化的代理需要优化,基于人口的平均状态的表示。受此概念启发的几个策略有助于在没有约束的情况下保持低内存使用率,但也会导致更快的收敛过程。然后,我们表明,所获得的动态接近最佳的行为,表示为一个下界的收敛时间分析。最后,我们设计了一个在线用户实验,收集关于人类在同一模型中的行为的数据,这表明他们确实有一个积极的主题选择策略,而不是随机选择。本论文的贡献还包括现有的网络游戏模型的分类和一个开源的框架来模拟它们。摘要Mots-Clés:主动学习-自动组织-语言的融合-语言的演变我们对与他人交往的规则-社会惯例-的理解非常深刻其他类型的不同类型的旅行在意义上是对第一人的旅行,但不能做出任何选择,因为有多种可能的选择:旅行路线、旅行费用形式或新词语的发明。因此,在欧洲,一项新的公约诞生于一个相互干预的人口中,在竞争中平等共存的多项公约并存的情况下,可能出现各种替代办法。他可能很难记住所有的东西,我们应该如何找到一个一致的效果?我们共同努力,对我们的培训情况进行控制,同时选择既不简单也不复杂的活动。他在一个蒙特里,这种类型的comportement,在这样的情况下,l 'estissage sensori-moteur,aide àadre mieux,plus vite,et avec moins d' esterples。这些机制是否也会影响社会公约的谈判?词汇是社会惯例的一个特殊部分:什么样的词汇与物体或意义有关?一个计算模型的类,语言游戏,通过一系列的成对交互作用,可能为一个使用共同语言的个体提供一种可能。特别是,该模型称为“游戏”,它强调依赖于词语和意义的形成,并在同义词或同音词的约定开始之前,对复杂性进行典型的爆炸,并达成共识。在此基础上,我们介绍了主动组织和主动控制博弈中复杂性的思想,形成了一种适用于交流互动的政治选择。介绍了不同的战略,以及对达成共识所需的时间和个人所需的记忆量的不同影响。首先,我们人为地限制了代理人的记忆,以避免复杂的现场爆炸。Quelques stratégies sontprésentées,certaines ayant des propriétés sim-ilaires au cas standard en termes de temps deconvergence.在第二个时期,我们根据人口的代表性确定了这些代理人的乐观态度。这两个战略启发了这样一个概念,即允许在没有限制系统的情况下限制记忆,并主要允许加速融合。我们的蒙特罗斯套间,使动态obtenue est proche最后,我们将在以下方面进行一次利用经验模特这些结果表明,与一种选择相比,他们在对话对象的选择上采取了积极的政策Les contributions de ce travail de thèse incluent aussi une classification des modèles demosquitos existants,et un cadriciel open source pour les simuler.内容我 介绍71介绍91.1社会习俗. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91.2当前和内在动机 . . . . . . . . . . . . . . . . . . . . . . . . . . .101 .一、二、1内在动机. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .101 .一、二、2机器人、算法和模型。 . . . . . . . . . . . . . . . . . . . . . . . .121.3语言进化的计算模型. . . . . . . . . . . . . . . . . . . .131 .一、3 .第三章。1现有模式。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .141 .一、3 .第三章。2与真实数据和行为的比较 . . . . . . . . . . . . . . . . . . . .151 .一、3 .第三章。3在语言游戏中主动学习。 . . . . . . . . . . . . . . . . . . . . .161.4本文 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .161 .一、四、1概述和结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .161 .一、四、2捐款。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .171 .一、四、3出版物。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18一点五简短摘要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .181 .一、五、1计算机科学家. . . . . . . . . . . . . . . . . . . . . . . . . . . . .191 .一、五、2物理学家和复杂性科学家。 . . . . . . . . . . . . . . . . . . .191 .一、五、[3]认知科学家。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .201 .一、五、4为大家补充。 . . . . . . . . . . . . . . . . . . . . . . . . . . .202游戏232.1模型的一般说明232.1.1意义和词空间252.1.2N、M和W值252.1.3词汇表262.1.4设想272.2措施和一般动态2.2.1收敛的概念282.2.2理论上的沟通成功282.2.3代理级局部复杂性292.2.4总体复杂性302.2.5其他措施302.2.6缩放312.3代理行为322.3.1词汇更新政策332.3.2接受政策352.3.3主题选择352.3.4词汇选择362.4人口一级的特点372.4.1社交网络372.4.2人口周转率2.5讨论382.5.1分类和标准模型定义2.5.2第39章游戏的问题II主动主题选择433记忆受限下的主动选择453.1导言.453.1.1探索与 剥削................................................................................................................ 463.1.2内存限制473.1.3ATC政策的两个层次483.2对内存的硬约束493.2.1决策向量政策493.2.2勘探偏差493.2.3信息增益最大化503.2.4Chunks Decision Vector strategy533.2.5与最佳向量53的比较3.3计算成功的互动543.3.1成功门槛553.3.2最小计数553.4全球比较3.4.1缩放573.4.2同音异义词573.4.3听者3.5讨论594原则性措施4.1第64章最后的策略4.2代理应该优化什么?...............................................................................................................644.2.1关于熵的问题644.2.2作为信息采样过程的664.2.3重建一个平均人口词汇674.2.4LAPS措施684.3衍生战略684.3.1精确值684.3.2多武装匪徒694.3.3一致性战略714.4结果724.4.1缩放724.4.2同音异义词724.4.3第73章倾听者4.5讨论745理论方法775.1记忆高峰785.1.1全球峰值785.1.2山顶785.1.3与发明数量的795.2收敛的统计下限805.2.1随机主题选择805.2.2每种意义的单一发明的收敛时间815.2.3反向传播信息815.2.4发明数量的统计下限825.2.5收敛时间的统计下限835.3业绩计量5.3.1Convergence time收敛时间5.3.2收敛速度855.3.3Exploration探索865.3.4传播865.3.5扩展速度875.3.6词典大小885.4讨论88III回到现实916人类行为936.1导言. 936.2实验设计946.2.1限制因素946.2.2招募参与者6.2.3互动966.2.4实验的结构966.2.5设置参数976.2.6第一个版本:Kreyon Conference996.2.7第二版1016.3结果1046.3.1措施1046.3.2分析说明1046.3.3分数1056.3.4发明数量和探索率6.3.5战略参数1056.4讨论108IV结论和展望1117结论1138未来展望1158.1听众8.2人口流动和接收政策1168.3网络上的扩散1168.4结构化意义空间1178.4.1连续空间1178.4.2Zipfian bias齐普菲偏见1178.4.3扩展空间1188.5共识动态1198.6人类行为1198.6.1用户实验1198.6.2分析现有数据库120附录A:开放源码模拟框架123A.1模拟博弈及其变体123A.2实验管理器:需要一个模拟框架124A.3ReScience:本论文128附录B:用户实验Web应用程序131B.1在新服务器131B.2第一个版本的屏幕133B.3第二版的屏幕138图目录1Illustration illustration流图12Deux robots avec des jambes différentes:Nao et Poppy23L’expérience du terrain de jeux4由代理人演变为典型的备忘录名称。41.1流程的简化图示111.2两个不同类型腿的机器人:Nao和Poppy121.3游乐场实验132.1NG模型概述242.2词汇的说明272.3标准NG的交互场景。272.4成功概率的典型演变292.5每个代理的字数的典型演变302.6公约数目的典型演变情况302.7第32章游戏中的尺度关系2.8最小NG词汇表更新说明342.9不同词汇表更新策略的比较。352.10 使用概率接受策略362.11 不同词汇表更新策略的比较。372.12 人口更替机制382.13 人口更替对全球动态2.14 本论文中使用的NG模型的模块化表示393.1标准交互场景提示453.2一个多武装的强盗。463.3ATC政策两个层次的说明483.4阻塞状态的图示493.5探索偏向策略的决策向量503.6TCS测量S(t)和归一化共享信息
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- StarModAPI: StarMade 模组开发的Java API工具包
- PHP疫情上报管理系统开发与数据库实现详解
- 中秋节特献:明月祝福Flash动画素材
- Java GUI界面RPi-kee_Pilot:RPi-kee专用控制工具
- 电脑端APK信息提取工具APK Messenger功能介绍
- 探索矩阵连乘算法在C++中的应用
- Airflow教程:入门到工作流程创建
- MIP在Matlab中实现黑白图像处理的开源解决方案
- 图像切割感知分组框架:Matlab中的PG-framework实现
- 计算机科学中的经典算法与应用场景解析
- MiniZinc 编译器:高效解决离散优化问题
- MATLAB工具用于测量静态接触角的开源代码解析
- Python网络服务器项目合作指南
- 使用Matlab实现基础水族馆鱼类跟踪的代码解析
- vagga:基于Rust的用户空间容器化开发工具
- PPAP: 多语言支持的PHP邮政地址解析器项目
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功