决策不确定性下的规划与强化学习:理论与应用
5星 · 超过95%的资源 需积分: 14 65 浏览量
更新于2024-07-20
6
收藏 5.93MB PDF 举报
《决策在不确定性下的挑战》是一本深入介绍决策支持系统设计者如何处理不确定性和多目标问题的著作。作者们聚焦于规划与强化学习这两种设计决策代理的方法,涵盖了概率模型、贝叶斯网络、效用理论、马尔可夫决策过程等多个核心概念。
首先,贝叶斯网络作为一种图形模型,被用来捕捉变量之间的概率关系,这对于理解决策中的不确定性至关重要。效用理论则提供了一种框架,指导在面临未知结果时做出最优决策。马尔可夫决策过程被用于处理序列决策问题,通过动态地更新状态和预测可能的结果来指导行动。
书中还探讨了模型不确定性,即决策者对系统模型的不完全理解,以及状态不确定性,即决策过程中实际状态的不确定性。此外,它涵盖了合作决策,即涉及多个相互作用的智能体共同决策的情况,这种复杂性在现实世界的许多应用场景中是常见的,如人搜索系统、语音应用、航空碰撞避免和无人驾驶飞机持久监视。
作者们威廉·德莱尼、艾伦·芬恩、彼得·赫斯特、迈克尔·科亨德弗、查尔斯-宾·张和凯尔-平·邓恩等,都是该领域的知名专家,他们的贡献确保了本书的深度和实用性。书中的实例应用广泛,包括基于属性的人脸搜索、语音识别技术、飞行器避障,以及无人侦察机的持续监控,这些都是将理论概念转化为实际解决方案的典型例子。
这本书以一致的符号系统统一了来自不同研究社区的研究成果,适合工程学科(如计算机科学、航空航天和管理科学)有概率论和微积分基础的学生和研究人员作为高级教材。同时,对于跨学科的研究人员而言,这也将是一部宝贵的参考文献,反映了麻省理工学院林肯实验室在国家安全领域应用先进技术所作出的卓越贡献。整个系列书籍延续了麻省理工辐射实验室系列的传统,致力于知识共享和技术传播。
2018-03-13 上传
2021-02-01 上传
点击了解资源详情
点击了解资源详情
2023-09-01 上传
2024-12-27 上传
2024-12-27 上传
2024-12-27 上传
2024-12-27 上传
SorelCheung
- 粉丝: 61
- 资源: 120
最新资源
- Python库 | mtgpu-0.2.5-py3-none-any.whl
- endpoint-testing-afternoon:一个下午的项目,以帮助使用Postman巩固测试端点
- 经济中心
- z7-mybatis:针对mybatis框架的练习,目前主要技术栈包含springboot,mybatis,grpc,swgger2,redis,restful风格接口
- Cloudslides-Android:云幻灯同步演示应用-Android Client
- testingmk:做尼采河
- ecom-doc-static
- kindle-clippings-to-markdown:将Kindle的“剪贴”文件转换为Markdown文件,每本书一个
- 减去图像均值matlab代码-TVspecNET:深度学习的光谱总变异分解
- 自动绿色
- Alexa-Skills-DriveTime:该存储库旨在演示如何建立ALEXA技能,以帮助所有人了解当前流量中从源头到达目的地所花费的时间
- 灰色按钮克星易语言版.zip易语言项目例子源码下载
- HTML5:基本HTML5
- dubbadhar-light
- 使用Xamarin Forms创建离线移动密码管理器
- matlab对直接序列扩频和直接序列码分多址进行仿真实验源代码