作為剛剛研一的同學,從研0開始就在導師、師兄師姐的幫助下學習 機器學習、深度學習和強化學習 ,也算是有了一些感悟和收獲可以與大家分享。如果有不對的地方歡迎批評指正~ 我發現很多同學跳過了學習機器學習基礎的階段,一上來就搭建一個數碼手寫體辨識的網絡,執行成功之後就感到特別快樂(曾是我哈哈哈~)但是過一會兒就有點悵然若失,why? 這玩意兒怎麽執行的?
網絡上那些說零基礎學習人工智能或者速成班的,一看就很假好吧。我認為想要學好人工智能,首先要掌握紮實的 數學分析、線性代數(含部份矩陣論)、概率論與數理統計 的知識,而這些是大一大二的必修課程!!~~
接下來投擲一些觀點和經驗:
(補充:學習學一些Git Linux的使用方法 浙大竺可楨學院 電腦那些沒教的知識 不是本人哈,就是碰巧看到了覺得講得很好~)
1. 機器學習基礎和深度學習要一起學,最好先學機器學習基礎再開始深度學習nndl · GitHub 復旦團隊的這本書非常不錯,從 機器學習基礎—深度學習—深度學習高階知識 ,可以說學完這本書的前兩個部份,應對機器學習八股文考核就沒有什麽問題~~ (同時結合面試反向學習的思路,能夠更好的拓展自己的知識面) 西瓜書+南瓜書 可以非常好的學習機器學習基礎的內容~ But 說實話機器學習基礎的課程一直沒有找到好的,現在在上軟件學院龍名盛老師的機器學習和深度學習課程,感覺是目前講得最好的!!!
2. 深度學習不僅要學習搭積木,還要學習基本理論,甚至學習如何調參台灣大學 - 李宏毅 - 機器學習深度學習(2021/2022公開教程匯總)_嗶哩嗶哩_bilibili
聽2021/2022的版本有很不錯的收獲~ 一定要完成其中的作業!! 學習pytorch的使用方法,transformer手寫一個之類的~
3. 強化學習最近非常火,如何用強化學習做控制的內容是非常熱門的方向之一柏克萊CS285的強化學習教程真的太棒了!!! CS285-嗶哩嗶哩_Bilibili
當然啦李宏毅老師的強化學習很好入門(但是講得不是很具體)
此外我還喜歡蘑菇書EasyRL
初探強化學習 上面這兩本書也非常棒,很適合入門呀!!!
但是你要從控制方面更加理論的學習強化學習,那麽我很推薦組裏的這本書(先學一學上面入門的課程,就可以暢遊在我們組裏的教材啦~)
Reinforcement Learning for Sequential Decision and Optimal Control | SpringerLink
下載連結上邊~~
(如果你學校買了Spring庫,電子版可以免費下載啦~)
RL英文教材簡介 | RL for Sequential Decision and Optimal Control
全書總共包括11章。第1章介紹強化學習(Reinforcement Learning, RL)概況,包括發展歷史、知名學者、典型套用以及主要挑戰等。第2章介紹RL的基礎知識,包括定義概念、自洽條件、最優性原理與問題架構等。第3章介紹免模型RL的蒙地卡羅法,包括Monte Carlo估計、On-policy/Off-policy、重要性采樣等。第4章介紹免模型RL的時序差分法,包括它衍生的Sarsa、Q-learning、Expected Sarsa等演算法。第5章介紹帶模型RL的動態規劃法,包括策略叠代、值叠代、通用叠代架構與收斂性證明等。第6章介紹間接型RL的函數近似法,包括常用近似函數、值函數近似、策略函數近似以及所衍生的Actor-critic架構等。第7章介紹直接型RL的策略梯度法,包括On-policy gradient、Off-policy gradient、它們的代價函數與最佳化演算法等。第8章介紹帶模型的近似動態規劃(ADP)方法,包括無窮時域的ADP、有限時域的ADP、ADP與MPC的聯系與區別等。第9章探討了狀態約束的處理手段,它與求解可行性、策略安全性之間的關系,以及Actor-Critic-Scenery三要素求解架構等。第10章介紹深度強化學習(DRL),即以神經網絡為載體的RL,包括神經網絡的原理與訓練,深度化挑戰以及DQN、DDPG、TD3、TRPO、PPO、DSAC等典型深度化演算法。第11章介紹RL的各類拾遺,包括魯棒性、POMDP、多智能體、元學習、逆強化學習、離線強化學習以及訓練框架與平台等。
編輯