没有合适的资源?快使用搜索试试~ 我知道了~
可在www.sciencedirect.com在线获取理论计算机科学电子笔记299(2013)101-121www.elsevier.com/locate/entcs探索-开发寻宝游戏中的交易1Dimitri Volchenkov,a,2JonathanHelbach,b,3MarkoTscherepanow,b,4SinaKuéheelc比勒费尔德大学物理系Universitaetsstr. 25,33615 Bielefeld,Germanyb比勒费尔德大学技术学院Universitaetsstr. 25,33615 Bielefeld,Germanyc生理心理学,比勒费尔德大学,邮政信箱100131,33501比勒费尔德,德国摘要在不同的虚拟环境中进行的搜索实验,在一个性别平衡的人群揭示了一个性别无关的搜索活动的大时空尺度上的无标度传播。 我们提出并解析了一个简单的相干噪声型统计模型,描述了人类的探索-剥削交易(“我应该留下还是应该离开”)。 该模型展示了各种跳跃行为,从在不确定性下发生的利维闪电,到有信心最终成功的寻宝者关键字:莱维觅食论文,探索-开发贸易,虚拟经济1介绍L'evyforaginghypothesis[1]-[3]提出,跳跃式searc h由从幂律分布得出的连续位移长度l组成(1)P(l) l−μ,1寻宝实验得到了认知交互技术卓越中心(CITEC,比勒费尔德大学)的支持D.V. 感谢财政支持,MatheMACS项目(2通讯作者。电子邮件地址:volchenk@physik.uni-bielefeld.de3现就职于IDIADA Fahrzeugtechnik GmbH,Manfred-Hochstatter-Straße 2,D-85055 Ingolstadt-Etting,Germany4与BeckhoAutomationGmbH,Huülshorstweg20,33415Verl,Germany合作1571-0661 © 2013 Elsevier B. V.在CC BY-NC-ND许可下开放访问。http://dx.doi.org/10.1016/j.entcs.2013.11.009102D. Volchenkov等人理论计算机科学电子笔记299(2013)101随着标度指数μ接近理论上的最优值μ= 2,将最大化觅食者找到稀疏和随机分布的猎物的机会[ 4 ]-[ 6 ],因此为空间密集搜索提供了一种有益的觅食运动模式与步行(1)被称为L'evymusicights[7],在许多活的物种中被发现,从微生物到人类[4]-[6],[8]-[20],尽管报告的标度指数在不同的环境背景下对不同的动物有很大的不同。总体数据中的光长度衰减速率通常由幂律描述,指数截止曲线表明指数衰减速率在极长的传播中占主导地位[13,21]。有人进一步建议[22,23],虽然人口总数的位移分布似乎显示出一个厚尾,但个体此外,当轨迹内的运动长度符合布朗行走(呈指数分布),但该指数分布的参数不同时,总体数据中具有指数截尾的幂律将由这些指数分布的叠加产生[23,24]。信天翁觅食轨迹的详细统计稳健分析[25]为搜索模式的个体特征提供了强有力的支持:一些轨迹被截断的L'evy分布估计(1),另一些则符合布朗运动模式,而很大一部分轨迹不符合任何一种分布,因为具有L'evy和布朗特征。进一步了解搜索行为的进展需要一个可行的生物机制模型,使动物和人类i。再现各种统计上不同的运动模式,而无需要求和繁琐的计算,以及ii.)在不同的环境中它们之间的自发转换。在我们的论文中,我们提出了这样一个模型,并解析地解决了它(第二节)。4)。VE提供了一种简单的方式来查看和体验现实世界,通过虚拟运动支持空间存在感,呈现清晰的导航感,并允许通过用户界面与对象进行交互[26]。毫不奇怪,VE近年来作为研究人类行为的工具得到了广泛的使用,保持了在严格控制的刺激条件下创造独特实验场景的能力。VE用户的一个主要问题是在空间中移动时保持其位置和方向的知识,基本上是当整个路径不能立即查看但被环境中的对象挡住时[27]。人类的大多数空间能力(如大规模空间导航和识别地点)都是自然进化而来的。在很长一段时间内,使用自然界中存在的属性作为空间定向和寻路的线索[28]。然而,许多自然的基于身体的自我运动线索在VE中缺失,导致受试者的系统性空间定向问题,因此需要发明新的适应策略以在减少的多感觉条件下通过VE移动。即时进化VE的自适应策略的分析强调搜索行为的关键生物机制比现场记录的经验数据的分析更生动此外,在VE中,我们可以通过以下方式D. Volchenkov等人理论计算机科学电子笔记299(2013)101103远获得最准确的数据几乎可比的规模,几米/十分之一秒,公里/小时(在GPS跟踪数据中,[19]),或几千公里/周的规模(在钞票旅行模式中,[11])在以前的研究中讨论过。为了理解适应性运动策略,并阐明环境结构在搜索和浏览中的作用,我们进行了一个寻宝实验(第二节)。2.1)与性别均衡的参与者群体(第二节)。2.3),在不同的情况下,VE(第2.3节)。2.2)。参与我们研究的人必须通过解决探索-开发困境(“我应该留下还是应该离开”)来决定如何在不确定性一方面,可以选择在最近的街区继续搜索(剥削),希望在隔壁得到或者,受试者可以探索她从未去过的环境部分搜索的实际轨迹是在所有时间尺度的所有行为水平上面临的开发和探索之间的永久平衡。我们表明,平衡开发和勘探可以负责统计上可行的sear-ching-bh-avour,从L'evy的光到布朗行走。值得一提的是,我们的实验设置与Gittins的假设不一致,Gittins提出了一种交易勘探和开发的最佳策略[30]。在我们的案例中,提供奖励的概率是不固定的,受试者没有将每个奖励的价值以在我们的研究中,受试者在不确定性中行动,因此对他们来说,任何最佳策略的计算都是不可能的性别通常被认为是空间认知研究中的决定性因素[39,40]。关于现实世界中空间能力的性别差异的综述见[41]。在本文中,我们不讨论我们的实验中观察到的性别流动性差异,留下一个详细的报告,即将出版。基于统计数据分析的结果,我们讨论了在通过VE时,扫描和重定向在补偿信息不足3.1),并在实验上观察到的超级扩散的搜索活动在大时空尺度(第3.1节)。3.2)。节中4,我们已经制定了一个数学模型的决策时,没有精确的信息的可能性奖励。该模型可以解决一些重要的情况下解析(见第二节)。4.3),并有助于产生关于决策的基本过程的生物学相关假设。我们在最后一节结束2方法2.1实验设计和程序在我们的寻宝实验中,每个参与者都被要求浏览一个虚拟环境,寻找可收藏的物品。对于每个时间框架,位置和104D. Volchenkov等人理论计算机科学电子笔记299(2013)101通过将位移和转向的集合视为一系列随机事件,其空间和时间分布被假设为具有一定的统计特性,跟踪并随后分析了参与者的航向定向。为了激励受试者彻底搜索,除了参与研究的基本报酬外,每个发现的对象都寻宝者既没有参观过VE模型的真实原型,也没有在参与实验之前预见到它的未来计划。搜索的对象是足够大的,对比色,清晰可见的玩具:泰迪熊和火车头。在每次试验开始时,一些玩具(10个玩具,对于较小的环境,15个玩具,对于较大的环境;见第二节。2.2)被随机分配到关闭的门之外的房间,每个房间一个玩具。对象一打开门进入房间,就可以立即找到物体。为了使被试集中精力完成任务,在实验过程中,实验者和被试之间没有进行任何交流在进入主要探索区域之前,每个参与者都在虚拟指导室中接受训练,以便习惯于计算机模拟环境的立体成像(两个略微不同的图像占瞳孔间距离,与立体眼镜配对,提供环境的3D显示),以便很好地掌握任天堂Wii遥控器,并通过按钮按压来判断他们所感知的运动。虽然搜索的时间没有限制,但我们限制了受试者在实验期间可以打开的门的总数(在较小的环境中为10扇门,在较大的环境中为15扇门),以防止在每个时刻进行顺序搜索并刺激受试者的探索活动。当参与者打开10(15)扇门时,实验结束。两个AVI视频片段显示了从第一人称角度进行实际搜索实验的记录,可以在URL下找到[31]。2.2虚拟环境利用Autodesk3ds MaxDesign 2010软件对Biele- feld大学现有的两个办公环境的虚拟模型进行渲染,然后使用Barco Galaxy NH-12主动立体3D立体投影仪将任何用户视点投影到墙壁宽的实验室屏幕(4m×2m)空间存在的感觉是在受试者中支持的受试者的自然色彩再现,扩展的灰度级,和高亮度的投影仪。通过VE对用户视点运动的控制是通过蓝牙连接的Wiimote实现的,Wiimote是任天堂Wii控制台的主要控制器VE模型A(图1.A)完全复制了属于认知交互技术中心(CITEC,比勒费尔德大学)的临时建筑(2012年)的第二层,VE模型B(图1.B)。1.B)模仿D. Volchenkov等人理论计算机科学电子笔记299(2013)101105A)。B)。Fig. 1.(彩色在线)两个模型的办公室VE被用于寻宝实验。 运动的各个空间通过空间图中的节点来识别。中心/节点相对于空间图的整个结构的隔离由颜色指示的随机游走的第一通过时间来A.)VE模型A由48个相互连接的空间组成,移动,具有单个中心位置(由红色节点表示的中心走廊),该位置与空间图中任意随机选择的节点相距9步。B.)VE模型B由68个相互连接的活动空间,包含一个连接良好的中心场所(大厅和连接走廊)网络,其特点是首次通行时间从10到14步不等目前正在建设中的未来交互式智能系统研究所(比勒费尔德大学)的地面走廊。这两种环境都包括标准的相邻办公室、会议室、走廊和走廊,为人们提供移动、会面和讨论的空间。在我们的实验中,没有考虑到实际建筑中存在的紧急出口和电梯VE模型A由48个相互连接的独立运动空间(由图1.A所示的空间图中的节点表示)组成,VE模型B包括68个相互连接的独立运动空间(图1所示的空间图的节点)。1.B)。空间结构很重要,因为它对邻近性有影响:建筑环境的连通性越大,通常意味着更直接的路线,从而缩短可能的目的地之间的距离。连通性也是一种选择性步行,它扩大了路线的选择范围,从而使城市内部的路线多样化106D. Volchenkov等人理论计算机科学电子笔记299(2013)101环境在环境的空间图中发现重要的运动空间并量化在[32]中,我们建议使用随机游动的性质来分析空间图的结构,并发现城市环境中的结构隔离。图中的每个节点相对于整个图的结构可以用第一次通过时间来表征,第一次到达节点(不重新访问任何中间节点)所需的预期步骤数,从图中随机选择的任何节点开始,根据随机游动的平稳分布。在建筑环境中,到达一个地方的第一次通过时间可以被理解为基本寻路指令的平均数量(例如“向左/向右转弯”,“经过门口”,“走在拐角处”等)。 需要导航一个流浪者 从环境中的其他地方转移到这个地方。在图1中,空间图A和B的节点的第一次通过时间的值用颜色表示(在线):具有最小第一次通过时间的中心位置用红色表示,具有最大第一次通过时间的隐蔽位置用紫色表示。利用空间图分析了虚拟企业模型A的空间结构。1.A模型的结构比B模型的结构简单与模型A相比3.1)。VE模型A中的单个中心空间节点(中心走廊)位于距离空间图中任意随机选择的节点9步处(图1.A)。VE模型B包含一个由良好连接的运动空间组成的网络,其特征在于第一次通过时间从10到14步不等2.3参与者两组性别平衡的志愿者(共82名参与者)参加了在图1所示的实验室VE中进行的受控搜索实验1.一种- B.虽然参与者(大部分是大学生,平均年龄为24.2岁,标准差为3.7岁)是通过个人和广告在比勒费尔德大学招募的。他们都不熟悉实际的建筑原型虚拟模型A和B。在测试之前-所有成年参与者和16岁以下儿童的父母都提供了参与研究的知情书面同意书。参与本研究是自愿的,参与者可以随时以任何理由撤销其参与同意并退出。遵守数据保护的标准规定:所有测试结果均保密。所有个人数据均以匿名方式管理和处理,消除了参与者身份识别的任何可能性D. Volchenkov等人理论计算机科学电子笔记299(2013)1011073结果和讨论3.1VE中的扫描转向、重新定向和探索性旋转通过VE的自我运动支持缺乏许多自然的身体为基础的线索。在虚拟现实中,自然的视觉探索方法也仅限于通过显示器体验的有限视野,这是由于设备延迟和阻挡周围所有视觉输入而导致的感官线索从各种实验中得出的结论是,至少对于虚拟显示系统的有限视野,没有本体感觉的光学反射似乎对更新航向方向无效[33],即使包括自由行走的物理运动提示,这也不一定足以在VE中实现良好的空间定向[34]。图二.在探索VE时,扫描转向、重新定向和探索旋转持续时间的典型分布。 垂直虚线表示转 弯 1的持续时间。5只可能是由于VE与真实世界情况的一致性中出现的系统性空间定向问题,参与我们研究的大多数受试者通过快速改变按下遥控器的左右按钮来永久执行快速扫描转向(200-300ms),每次使他们转向更大或更小的角度。也许,这样的运动程序对正确的自我运动知觉起着重要的作用,作为补偿受试者在减少的多感觉条件下通过VE运动时所经历的信息缺乏。当受试者改变行走方向或避开障碍物时,观察到更长的转弯(大约半秒)。最终,在远距离重新定位之后,在有利位置,沿着两个或几个远景空间的边界,以及在走廊的交叉点,通常包括几个完整的旋转(每次持续几秒钟),这是一个非常长的探索性旋转,可以获得更广阔的环境视野在探索VE时,扫描转向、重新定向和探索旋转持续时间的典型分布如图2所示。直方图中相邻矩形的面积等于持续时间间隔内观测的相对频率。直方图的总面积被归一化为数据出现的次数。数据显示,绝大多数的重新定向108D. Volchenkov等人理论计算机科学电子笔记299(2013)1011.)的人。2.)的情况。图三.模型A和B的地板平面图,以及有利位置的位置(用圆圈表示),其中参与者进行了持续时间超过1的重新定向和探索性转弯。5只 直径圆的长度与在其中心点记录的长圈数成比例由受试者进行的是快速扫描转弯,是VE中自适应步行程序的重要组成部分图2中的垂直虚线代表旋转持续时间1。5s;对应点的位置,在该位置处,参与者进行了较长的转弯(无平移),并通过圆圈显示在地板平面图上(见图3.1和3.2)。一个圆的直径与所有被试在其中心点记录的长圈数对小动物进行的几项研究[14,15],[35,36]表明,动物运动模式中的扫描和重定向行为之间的转换,搜索来自动物对局部环境的复杂机械-感觉反应,可以推断出有限感知和/或不完整环境结构的影响。当探索斑块资源时,动物可以调整转向角分布,选择一个优选的转向角值,使生物体在斑块内停留适当的时间,最大化能量增益。例如,水蚤的Z字形运动似乎是斑块开发的最佳策略[36]。因此,快速扫描转向和更长时间的重新定位行为之间的区别对于理解搜索的统计模式至关重要[1]。作为虚拟环境中行走过程的一部分,受试者在行走过程中所做的快速扫描转弯会在对环境局部结构特征敏感的相对较小的时空尺度上引起转弯总旋转持续时间与净位移之间的在达到无障碍运动的可用空间的自然极限或进入新的运动区域之后,受试者进行更长时间的重新定向,也许是为了在视觉上探索打破相关性的新环境。我们使用适用于检测相关性的均方根波动(RMSF)分析了通过两种VE模型的受试者重新定向持续时间的数据[37,4]。位移的RMSF由Fs(n)=D. Volchenkov等人理论计算机科学电子笔记299(2013)101109k=1.k=1见图4。总转弯持续时间的均方根波动(RMSF)通过RMSF显示对于所有受试者的所有记录的重新定向点,在双对数标度中的净位移, VE模特。. .(ΔS(n))2<$−<$ΔS(n)<$2,其中,第n次重定向为S(n)=<$n<$rk+1−rk<$r k是记录的位置第k次重定向的平均值为Δ S(n)= S(n + n0)−S(n0),角括号表示所有数据点n0 = 1,. n最大值 同样,ro的RMSF-站持续时间由yFτ(n)=计算。(ΔT(n))2<$−<$ΔT(n)<$2,其中,通过第n次重新定向的对象的总旋转持续时间是T(n)=nτk,τk是第k次重定向的持续时间,ΔT(n)=T(n+n0)-T(n0),以及角括号再次表示所有数据点的平均值。在图4中,我们将VE模型A和B中所有记录的受试者重新定向的净位移的RMSF和总旋转持续时间的RMSF以双对数标度同样,对于两种VE模型,图表显示超线性斜率e,dlogFτ/dlogFsτ=1。1,表明存在一个强随着被摄体净位移的增加,快速扫描的总持续时间增加。从长远来看,由快速尺度扫描行为产生的相关性消失,这对于相关随机游走过程是典型的[14]。有趣的是,VE模型A和B中转向持续时间的均方根值和净位移的均方根值的相关范围不同:VE模型A中,净位移的相关范围为0.1 ~ 6m, VE模型B中,净位移的相关范围为0.3 ~10m也许,净位移的相关范围的差异是由于可用于无障碍运动的平均空间的大小不同,110D. Volchenkov等人理论计算机科学电子笔记299(2013)101模型A和B。很明显,这种密集的空间扫描仅由受试者在其紧邻区域内执行,并且原则上不能扩展到整个VE,甚至不能扩展到其任何重要部分,因为所需时间的超线性增加使得大时空尺度上的扫描过程在生物学上是不可行的。因此,在根据环境的结构特性在大小的块内完成密集搜索阶段之后,寻宝者移动到某个其他区域,在那里重新开始密集搜索阶段。 值得一提的是,在大的时空尺度上,重定向行为可以产生不同的异常差异机制,这反过来又可以影响随机探索过程的搜索效率[14]。3.2虚拟环境中人类出行的重尾分布为了在记录的运动模式中识别特定活动的阶段,并从其统计特性中揭示潜在的认知机制,我们研究了时间间隔的概率分布和随后可观察到的搜索事件(开门)之间的距离,因为它们可以确定运动的离散特性和轨迹的相关空间特性的强烈变化图5显示了两种VE模型中寻宝者在实验期间分散的分布数据。发现性别是VE中导航的一个因素:据报道,男性比女性更快地从地标获得路线知识[42],并且在定位目标上花费的时间更少[43]。有趣的是,经验观察到的分布形式(图5)既不具有性别特异性,也不对环境的不同全球结构数据表明,大多数随后的开门发生在参与者的实际位置的直接邻域中。图5所示的小时空尺度上的扩散统计可以很好地近似于不相关的高斯随机游走(见虚线钟形曲线),对环境的局部结构不敏感。图5中的两个分布都很引人注目,因为二次双曲线主导的长右尾削弱了寻宝者在大时空尺度上的超扩散。旅行时间和旅行距离的概率分布中的幂律尾部可能来自于这样的过程,在这些过程中,时间和距离都没有特定的特征尺度,因此可能发生罕见但极长且遥远的扩散数据中的幂律尾提供了一个证据,支持沿着不能立即看到的路径的大规模运动与环境结构之间的强耦合。与许多经验现象一样,图5所示分布的尾部仅在空间(约10m)和时间(约20sec)上大于某些最小尺度smin的值时遵循幂律,这与前一节关于直接邻域动态形成的结论一致,其中受试者执行密集扫描。我们的观察D. Volchenkov等人理论计算机科学电子笔记299(2013)101111图五.直方图示出了随后的门打开之间的行进时间的频率,时间的函数。钟形虚线曲线表示高斯分布。偶尔的长途旅行有助于由二次双曲线主导的分布的长右尾。在轮廓上,关于后续搜索事件的扩散的数据被示出为VE模型A(通过黑点)和VE模型B(通过灰点)的双对数尺度中的距离的函数。固体引导线指示反二次斜率。 二次双曲线下降构成“肥尾” 在许多生活香料的觅食运动模式中检测到的效果,[4]-[6],[8]-[20],根据[1]-[3]。与假设一致,即在参与研究的人群中观察到的旅行时间和旅行距离都是从形式为f(s)(smin/s)2的尺度不变分布中得出的,因此如果尺度乘以公因子,则对于smin然而,重要的是要注意,在个体搜索行为的样本上估计的离散度的统计可能与幂律(1)不同,就像遵循指数分布一样,因为这些样本中的许多样本在统计上不具有代表性。因此,尽管图1所示分布的幂律尾5与L'evy的觅食假说[1]-[3]一致,它们更代表了一种群体聚集特征。从几何上讲,具有来自L′evy分布的运动位移的离散步随机游动由具有非常大的位移的游动簇组成,因为它们在很宽的尺度范围内表示[8,38]。虽然L'evy的搜索策略无处不在,可以代表我们所知的生活香料中的间歇性搜索,巡航和觅食策略,但这是关于L'evy的搜索模式在人类探索VE中的作用的第一次报告112D. Volchenkov等人理论计算机科学电子笔记299(2013)1014搜索行为的探索-开发交易模型4.1支持自组织批判模型的论点在VE中观察到的人类搜索行为的统计特性需要一个模型,该模型可以表现出相变临界点的尺度不变特性(对应于由L'evy分布描述的超分散无标度扩散),而不需要将任何控制参数调整到精确值。在统计物理学中,动力系统的这种性质被称为自组织临界性[44]。此外,一个合理的模型必须具有离散的性质,因为间歇运动的生物学原理假设动物行为必然会产生可观察到的标点,这些动机反映了寻宝者面临的基本从理论的角度来看,众所周知,在一个固定的环境中,存在一个最优的探索策略[30],当每个奖励的价值作为获得时间的函数以指数方式贴现时,在无限范围内最大化奖励然而,到目前为止,对于探索与开发问题,还没有普遍的最佳解决方案[45,29],因为人类和其他动物倾向于动态更新他们对奖励的估计,以响应各种各样的,可变的,可能不一致的因素,包括搜索的时间,预测搜索对象的位置的恼人失败,以及可能在几秒钟内改变的瞬时情绪因此,似乎管理勘探和开采之间平衡的随机模型可能更具生物现实性[29]。越来越多的证据表明,参与评估人类回报和不确定性的神经调节系统是探索-开发交易决策的核心[45]。这个问题可以通过区分预期的不确定性来解决,预期的不确定性来自预测线索的已知不可靠性,并通过乙酰胆碱信号在大脑中编码,而意外的不确定性则由强烈的意外观察引发,促进探索并在大脑中编码去甲肾上腺素信号[46]。在[46]中有人提出,一个人根据乙酰胆碱和去甲肾上腺素的当前水平决定是留下还是离开,编码不同类型的不确定性。总结上述论点,我们感兴趣的是一个自组织的临界模型驱动的离散时间随机过程之间的竞争的两个因素具有不同类型的不确定性。讨论了各种具有合理特征的相干噪声模型[47,48],并结合自组织临界状态中开发的标准沙堆模型[44]进行了讨论,其中雪崩大小和持续时间的统计数据也采用幂律形式。D. Volchenkov等人理论计算机科学电子笔记299(2013)1011134.2随机搜索决策的数学模型运动生态学框架[49]明确承认动物运动是环境线索(外部因素)和动物内部状态之间持续“对话”的结果在我们的模型中,我们合理化了决策过程的对话性质,以便在高度不可预测的情况下进行搜索,因为没有关于奖励可能性的确切信息。尽管其固有的简单性,下面制定的数学模型可以帮助生成关于基本生物过程的假设,并带来了在共同视角下寻找各种生物机制我们假设一个人决定是通过搜索隔壁以外的地方来 p + q = 1是不必要的。我们假设,在每次点击时,主体更新一个或两个估计,并决定继续到环境的一部分,如果q p。否则,如果q≥p,她会在尚未打开的门中随机选择一个,然后在后面的房间里寻找宝藏。我们认为p和q分别是关于概率分布函数(pdf)Pr{pu} =G(u)和Pr{qu} =F(u)分布在区间[0,1]上的随机变量。一般来说,F和G是两个任意左连续增函数,满足正规化条件F(0)=G(0)= 0,F(1)=G(1)= 1。我们通过以下方式用离散时间随机过程对间歇性搜索模式进行建模在时间t= 0时,变量q相对于pdfF选择,并且p可以相对于pdfG选择。如果q p,受试者通过按下控制器上的按钮重新定位,并进入时间t= 1。给定一个固定的实数η∈[0,1],在时间t≥1时,以下事件发生:(i) 在概率为η的情况下,在近邻找到宝藏的机会(q)用pdf F估计,在别处得到奖励的机会(p)用pdf G选择。否则,(ii) 在概率为1−η的情况下,在近邻找到宝藏的机会(q)用pdfF估计,但在别处找到宝藏的机会(p)保持它在时间t−1时的值因此,参数η量化了分别由pdf F和G表征的两个随机子过程之间的相干程度:如果η = 1,则过程是相干的,而当η = 0时,过程是不相干的。如果q≥p,则局部搜索阶段继续;然而,如果q p,则受试者按下控制器按钮并进一步移动,进入时间t+ 1。最终,在某个时间步t,当估计的机会q超过值p时,主体停止并恢复在紧邻区域内的搜索。在该随机过程中获得的整数值t=T限制了搜索活动的连续阶段之间的时间间隔(和行进距离)。114D. Volchenkov等人理论计算机科学电子笔记299(2013)1010∫0.=<$1dG(p)F(p)η(1−F(p))+<$1dG(p)F(p)(1−η)<$1dG(z)(1−F(z))4.3决策过程的分析解决方案在研究SEC中介绍的模型时,4.2中,我们感兴趣的是重新定位阶段Pη(T;F,G)的持续时间的分布,前提是概率分布F和G是给定的,并且相干参数η是固定的。对于许多分布F和G,该模型可以解析求解。 我们用P(T)简单地表示Pη(T;F,G)。一个简单的计算直接从定义中表明P(0)= 1dG(p)(1 −F(p))。对于T≥1,个体可以离开别处(这两个事件都可以以“相关”的方式发生对于T= 1,例如,P(1)=P[DSc]+P[DSu]同样地,0 0 0=ηB(1)+(1 − η)A(1)B(0)。P(2)=η2B(2)+η(1−η)A(1)B(1)+η(1−η)A(2)B(0)+(1−η)2A(1)2B(0)其中我们定义,A(n)=1dG(p)F(p)n和B(n)=A(n)A(n+ 1),对于n=0,1,2,....引入P(T)的生成函数是有用的,P(s)=s TP(T),P(T)=1个dTP(s).T=0定义以下辅助功能T! dsT.s=0我们发现(2)x(l)= η l A(l +1),对于 l≥1,x(0)= 0,y(l)=(1−η)lA(1)l−1,对于l≥1,y(0)=0,z(l)=ηl[ηB(l+ 1)+(1−η)A(l+ 1)B(0)],对于l≥1,z(0)= 0,ρ =ηB(1)+(1 −η)A(1)B(0),P(s)=B(0)+ρs+s[z(s) +ρx(s)y(s) +ρA(1)y(s) +A(1)y(s)z(s)]1−x(s)y(s)其中,x∈(s)、y∈(s)和z∈(s)分别是x(l)、y(l)和z(l)的生成函数。在临界情况下,η= 0和η= 1,概率P(T)可以很容易地计算出来。对于η= 0,我们有(2)∞D. Volchenkov等人理论计算机科学电子笔记299(2013)101115(三)Pη=0B(0)(s)=.1−sA(1)116D. Volchenkov等人理论计算机科学电子笔记299(2013)101∈ˆ∫1⎣从(3),得到⎡∫1T1001(四)Pη=0(T)=A(1)TB(0)=0dG(p)F(p)dG(p)(1 − F(p))。0因此,在这种情况下,对于pdf F和G的任何选择,概率P(T)dec始终表示p。对于η=1,(2)产生Pη=1(s)=B(s),因此,(五)Pη=1(T)=B(T)=dG(p)F(p)T(1 − F(p))。0对于均匀密度dF(u)=dG(u)=du的特殊情形,对所有u∈[0,1]和任何η[0,1].在这种情况下,可以给出P(s)和P(T)的更简单和明确的表达式。也就是说,从等式(2),我们得到(6)P(s)=1<$ 1 +γ(s)−ηγ(s)<$,γ(s)<$ln(1−ηs).1+(1−η)γ(s)s ηs当T→ ∞时P(T)的渐近行为由最接近原点的生成函数P(s)的奇异性决定。当η=0时,生成函数P(s)=(2−s)−1有一个简单的极点,因此P(T)在幂次上与结果(4)一致对于中间值0<η<1,生成函数P∈(s)有两个奇点.第一个极点s = s0,对应于消失的分母1+(1 − η)γ(s),其中s0= s0(η)是方程的唯一非平凡解-ln(1 − ηs)= ηs/(1 − η)。 第二个奇点s = s1= η−1,对应于对数的零辐角。很容易看出,1
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 探索数据转换实验平台在设备装置中的应用
- 使用git-log-to-tikz.py将Git日志转换为TIKZ图形
- 小栗子源码2.9.3版本发布
- 使用Tinder-Hack-Client实现Tinder API交互
- Android Studio新模板:个性化Material Design导航抽屉
- React API分页模块:数据获取与页面管理
- C语言实现顺序表的动态分配方法
- 光催化分解水产氢固溶体催化剂制备技术揭秘
- VS2013环境下tinyxml库的32位与64位编译指南
- 网易云歌词情感分析系统实现与架构
- React应用展示GitHub用户详细信息及项目分析
- LayUI2.1.6帮助文档API功能详解
- 全栈开发实现的chatgpt应用可打包小程序/H5/App
- C++实现顺序表的动态内存分配技术
- Java制作水果格斗游戏:策略与随机性的结合
- 基于若依框架的后台管理系统开发实例解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功