本書初版主要講解序列決策問題中的核心理論和演算法,基於該主題與不動點(fixed point)理論的強大聯系。分析的重點是作為動態規劃基礎的抽象對映,並定義了相關問題的數學特征。本書涉及的討論集在這個對映可能具有的兩個基本性質上:單調性和(加權超範數)收縮性。事實證明,分析和演算法動態規劃理論的性質主要由這兩個內容的存在與否決定,問題結構的其余部份在很大程度上是無關緊要的。
本書最新版pdf下載地址: 強化學習新書-【抽象動態規劃第二版】免費pdf分享
本書的第二版的主要目的是擴大第三章和第四章的半導體(semi-contractive)模型的介紹,並補充自第一版編寫以來在期刊和報告中獲得和發表的廣泛研究成果。結果,本書的內容量增加了一倍多,頁書也增加了大約40%。
本書目錄
本書內容截圖
本書免費pdf下載地址: 強化學習新書-【抽象動態規劃第二版】免費pdf分享
往期精品內容推薦
英文學術會議參會必讀-【青年學者會議和演講英語指南】免費pdf分享
密芝根大學Justin Johnson-【深度學習與電腦視覺】課程影片及ppt分享
機器學習實戰書籍-【Python機器學習專案實戰】免費分享
博士入坑必讀教材-【A-Z博士(PhD)順利畢業必讀指南】新書免費分享
Yan Lecun-自監督學習技術概述
深度學習推薦系統、CTR預估工業界實戰論文整理分享
Barbara Plank-NLP模型的跨語言/跨領域遷移-經驗分享
Yann LeCun-深度學習帶來的技術進步和局限性
歷史最全-130本科技互聯網類免費書籍整理-匯總分享