本书初版主要讲解序列决策问题中的核心理论和算法,基于该主题与不动点(fixed point)理论的强大联系。分析的重点是作为动态规划基础的抽象映射,并定义了相关问题的数学特征。本书涉及的讨论集在这个映射可能具有的两个基本性质上:单调性和(加权超范数)收缩性。事实证明,分析和算法动态规划理论的性质主要由这两个属性的存在与否决定,问题结构的其余部分在很大程度上是无关紧要的。
本书最新版pdf下载地址: 强化学习新书-【抽象动态规划第二版】免费pdf分享
本书的第二版的主要目的是扩大第三章和第四章的半导体(semi-contractive)模型的介绍,并补充自第一版编写以来在期刊和报告中获得和发表的广泛研究成果。结果,本书的内容量增加了一倍多,页书也增加了大约40%。
本书目录
本书内容截图
本书免费pdf下载地址: 强化学习新书-【抽象动态规划第二版】免费pdf分享
往期精品内容推荐
英文学术会议参会必读-【青年学者会议和演讲英语指南】免费pdf分享
密歇根大学Justin Johnson-【深度学习与计算机视觉】课程视频及ppt分享
机器学习实战书籍-【Python机器学习项目实战】免费分享
博士入坑必读教材-【A-Z博士(PhD)顺利毕业必读指南】新书免费分享
Yan Lecun-自监督学习技术概述
深度学习推荐系统、CTR预估工业界实战论文整理分享
Barbara Plank-NLP模型的跨语言/跨领域迁移-经验分享
Yann LeCun-深度学习带来的技术进步和局限性
历史最全-130本科技互联网类免费书籍整理-汇总分享