如何將機器人與強化學習結合？

2021-03-18科學

作為剛剛研一的同學，從研0開始就在導師、師兄師姐的幫助下學習 機器學習、深度學習和強化學習 ，也算是有了一些感悟和收獲可以與大家分享。如果有不對的地方歡迎批評指正~ 我發現很多同學跳過了學習機器學習基礎的階段，一上來就搭建一個數位手寫體辨識的網路，執行成功之後就感到特別快樂（曾是我哈哈哈~）但是過一會兒就有點悵然若失，why? 這玩意兒怎麽執行的？

網路上那些說零基礎學習人工智慧或者速成班的，一看就很假好吧。我認為想要學好人工智慧，首先要掌握紮實的 數學分析、線性代數（含部份矩陣論）、機率論與數理統計 的知識，而這些是大一大二的必修課程！！~~

接下來丟擲一些觀點和經驗：

（補充：學習學一些Git Linux的使用方法浙大竺可楨學院電腦那些沒教的知識不是本人哈，就是碰巧看到了覺得講得很好~）

1. 機器學習基礎和深度學習要一起學，最好先學機器學習基礎再開始深度學習

nndl · GitHub 復旦團隊的這本書非常不錯，從 機器學習基礎—深度學習—深度學習高階知識 ，可以說學完這本書的前兩個部份，應對機器學習八股文考核就沒有什麽問題~~ （同時結合面試反向學習的思路，能夠更好的拓展自己的知識面） 西瓜書+南瓜書 可以非常好的學習機器學習基礎的內容~ But 說實話機器學習基礎的課程一直沒有找到好的，現在在上軟體學院龍名盛老師的機器學習和深度學習課程，感覺是目前講得最好的！！！

2. 深度學習不僅要學習搭積木，還要學習基本理論，甚至學習如何調參

台灣大學 - 李宏毅 - 機器學習深度學習（2021/2022公開教程匯總）_嗶哩嗶哩_bilibili

聽2021/2022的版本有很不錯的收獲~ 一定要完成其中的作業！！學習pytorch的使用方法，transformer手寫一個之類的~

3. 強化學習最近非常火，如何用強化學習做控制的內容是非常熱門的方向之一

柏克萊CS285的強化學習教程真的太棒了！！！ CS285-嗶哩嗶哩_Bilibili

當然啦李宏毅老師的強化學習很好入門（但是講得不是很具體）

此外我還喜歡蘑菇書EasyRL

初探強化學習上面這兩本書也非常棒，很適合入門呀！！！

但是你要從控制方面更加理論的學習強化學習，那麽我很推薦組裏的這本書（先學一學上面入門的課程，就可以暢遊在我們組裏的教材啦~）

Reinforcement Learning for Sequential Decision and Optimal Control | SpringerLink

下載連結上邊~~

（如果你學校買了Spring庫，電子版可以免費下載啦~）

RL英文教材簡介 | RL for Sequential Decision and Optimal Control

全書總共包括11章。第1章介紹強化學習（Reinforcement Learning, RL）概況，包括發展歷史、知名學者、典型套用以及主要挑戰等。第2章介紹RL的基礎知識，包括定義概念、自洽條件、最優性原理與問題架構等。第3章介紹免模型RL的蒙地卡羅法，包括Monte Carlo估計、On-policy/Off-policy、重要性采樣等。第4章介紹免模型RL的時序差分法，包括它衍生的Sarsa、Q-learning、Expected Sarsa等演算法。第5章介紹帶模型RL的動態規劃法，包括策略叠代、值叠代、通用叠代架構與收斂性證明等。第6章介紹間接型RL的函式近似法，包括常用近似函式、值函式近似、策略函式近似以及所衍生的Actor-critic架構等。第7章介紹直接型RL的策略梯度法，包括On-policy gradient、Off-policy gradient、它們的代價函式與最佳化演算法等。第8章介紹帶模型的近似動態規劃（ADP）方法，包括無窮時域的ADP、有限時域的ADP、ADP與MPC的聯系與區別等。第9章探討了狀態約束的處理手段，它與求解可行性、策略安全性之間的關系，以及Actor-Critic-Scenery三要素求解架構等。第10章介紹深度強化學習（DRL），即以神經網路為載體的RL，包括神經網路的原理與訓練，深度化挑戰以及DQN、DDPG、TD3、TRPO、PPO、DSAC等典型深度化演算法。第11章介紹RL的各類拾遺，包括魯棒性、POMDP、多智慧體、元學習、逆強化學習、離線強化學習以及訓練框架與平台等。

編輯