當前位置: 華文問答 > 科學

如何將機器人與強化學習結合?

2021-03-18科學

作為剛剛研一的同學,從研0開始就在導師、師兄師姐的幫助下學習 機器學習、深度學習和強化學習 ,也算是有了一些感悟和收獲可以與大家分享。如果有不對的地方歡迎批評指正~ 我發現很多同學跳過了學習機器學習基礎的階段,一上來就搭建一個數位手寫體辨識的網路,執行成功之後就感到特別快樂(曾是我哈哈哈~)但是過一會兒就有點悵然若失,why? 這玩意兒怎麽執行的?

網路上那些說零基礎學習人工智慧或者速成班的,一看就很假好吧。我認為想要學好人工智慧,首先要掌握紮實的 數學分析、線性代數(含部份矩陣論)、機率論與數理統計 的知識,而這些是大一大二的必修課程!!~~

接下來丟擲一些觀點和經驗:

(補充:學習學一些Git Linux的使用方法 浙大竺可楨學院 電腦那些沒教的知識 不是本人哈,就是碰巧看到了覺得講得很好~)

1. 機器學習基礎和深度學習要一起學,最好先學機器學習基礎再開始深度學習

nndl · GitHub 復旦團隊的這本書非常不錯,從 機器學習基礎—深度學習—深度學習高階知識 ,可以說學完這本書的前兩個部份,應對機器學習八股文考核就沒有什麽問題~~ (同時結合面試反向學習的思路,能夠更好的拓展自己的知識面) 西瓜書+南瓜書 可以非常好的學習機器學習基礎的內容~ But 說實話機器學習基礎的課程一直沒有找到好的,現在在上軟體學院龍名盛老師的機器學習和深度學習課程,感覺是目前講得最好的!!!

2. 深度學習不僅要學習搭積木,還要學習基本理論,甚至學習如何調參

台灣大學 - 李宏毅 - 機器學習深度學習(2021/2022公開教程匯總)_嗶哩嗶哩_bilibili

聽2021/2022的版本有很不錯的收獲~ 一定要完成其中的作業!! 學習pytorch的使用方法,transformer手寫一個之類的~

3. 強化學習最近非常火,如何用強化學習做控制的內容是非常熱門的方向之一

柏克萊CS285的強化學習教程真的太棒了!!! CS285-嗶哩嗶哩_Bilibili

當然啦李宏毅老師的強化學習很好入門(但是講得不是很具體)

此外我還喜歡蘑菇書EasyRL

初探強化學習 上面這兩本書也非常棒,很適合入門呀!!!

但是你要從控制方面更加理論的學習強化學習,那麽我很推薦組裏的這本書(先學一學上面入門的課程,就可以暢遊在我們組裏的教材啦~)

Reinforcement Learning for Sequential Decision and Optimal Control | SpringerLink

下載連結上邊~~

(如果你學校買了Spring庫,電子版可以免費下載啦~)

RL英文教材簡介 | RL for Sequential Decision and Optimal Control

全書總共包括11章。第1章介紹強化學習(Reinforcement Learning, RL)概況,包括發展歷史、知名學者、典型套用以及主要挑戰等。第2章介紹RL的基礎知識,包括定義概念、自洽條件、最優性原理與問題架構等。第3章介紹免模型RL的蒙地卡羅法,包括Monte Carlo估計、On-policy/Off-policy、重要性采樣等。第4章介紹免模型RL的時序差分法,包括它衍生的Sarsa、Q-learning、Expected Sarsa等演算法。第5章介紹帶模型RL的動態規劃法,包括策略叠代、值叠代、通用叠代架構與收斂性證明等。第6章介紹間接型RL的函式近似法,包括常用近似函式、值函式近似、策略函式近似以及所衍生的Actor-critic架構等。第7章介紹直接型RL的策略梯度法,包括On-policy gradient、Off-policy gradient、它們的代價函式與最佳化演算法等。第8章介紹帶模型的近似動態規劃(ADP)方法,包括無窮時域的ADP、有限時域的ADP、ADP與MPC的聯系與區別等。第9章探討了狀態約束的處理手段,它與求解可行性、策略安全性之間的關系,以及Actor-Critic-Scenery三要素求解架構等。第10章介紹深度強化學習(DRL),即以神經網路為載體的RL,包括神經網路的原理與訓練,深度化挑戰以及DQN、DDPG、TD3、TRPO、PPO、DSAC等典型深度化演算法。第11章介紹RL的各類拾遺,包括魯棒性、POMDP、多智慧體、元學習、逆強化學習、離線強化學習以及訓練框架與平台等。

編輯