當前位置: 華文問答 > 科學

如何自學生物資訊學?

2018-12-31科學

自己也是半路出家,之前學生物學,後來接觸到生物資訊學。突然覺得這就是我今後為之奮鬥的目標,從開始的一知半解,到後來的格物致知,慢慢發現這真的是一門特有趣的學科。但是當時資料和教程五花八門,而且沒有人指導自己學的比較費力。為了不讓大家再走我之前自學生信時候踩過的坑,走過的彎路,將一些比較重要的入門書籍,網站和後續的學習渠道總結如下,供大家參考。

目錄

  • 統計學
  • 系統操作
  • 程式語言
  • 生物學
  • 學習渠道
  • 知乎圈子: 生物資訊 (分享,學習和吐槽生物資訊)

    統計學

  • StatQuest
  • 生物統計學影片,包含統計學基礎和生信所涉及的統計學概念,作者力圖用視覺化並結合有意思的例子來讓統計學菜鳥盡快熟悉內部原理。

    作者是國外的大神,所以他的教程是全英文,在YouTube上正選。後來國內的B站UP取得作者授權,將影片傳到國內並配上了中文字幕,後邊程式碼也是這個UP主上傳的。

    YouTube:https://www. youtube.com/playlist? list=PLblpJKOoLUJo2Q6xK4tZElbIvAACEykp

    B站網址:https:// space.bilibili.com/2573 47536?from=search&seid=13661736885600696159

    一部份R程式碼:https:// pan.baidu.com/s/1GQXa0P 0_vX_bHgrWVEmAYA 提取碼:c2wk

  • 深入淺出統計學
  • 用大量例子來講解統計學的一些概念,如果不習慣英語影片,可以先用這本書來熟悉。

    系統操作

  • 鳥哥的Linux私房菜 基礎學習篇
  • 生信的大部份軟件和分析流程都需要依靠伺服器來做,因此避免不了Linux的使用。開始學習不用背全部命令,常用命令和參數輸入多遍就會記住,如果對某個命令想深入學習,可以將這本書翻開看看。

  • 鳥哥的Linux私房菜:伺服器架設篇
  • 如果今後不涉及數據庫設計或其他運維工作,這本書可以不看,只做了解。

    程式語言

  • R語言實戰
  • R語言是目前生信數據處理的主要程式語言,涵蓋大量的包來處理不同的生信需求,因此對於R語言的學習必不可少。

  • ggplot2:數據分析與圖形藝術
  • 某種意義上講,R吸引人們使用它的重要原因就是這個包的存在。它提供了大量的可設定的視覺化操作方式,幾乎可以繪制出任何使用者想繪制的圖形。

    下面是利用ggplot2繪制的圖形

  • 廖雪峰 Python 教程
  • 網站簡潔大方,教程附帶大量例子,可以使新手快速進入python的學習中。

    網址:https://www. liaoxuefeng.com/wiki/10 16959663602400

  • Python基礎教程
  • Python 同樣逐步進入生信領域,包括Pandas,Matplotlib,Biopython等庫都可以方便的執行生信分析任務。同樣,也包含一些機器學習包,可以用於生物資訊學的工作中。

  • Biopython 包
  • 一般生信分析指令碼的工具集。包括核酸序列處理,NCBI,UniProt數據庫操作等其他常用的生信工具。

    中文教程:https:// biopython-cn.readthedocs.io /zh_CN/latest

    英文教程:http:// biopython.org/DIST/docs /tutorial/Tutorial.html

    GitHub:https:// github.com/biopython/bi opython

  • pandas 包
  • 用於分析結構化數據的python包,包括對數據去空值,統計值計算,添加,刪除,插入,修改,提取等等操作。由於底層基於C,所以可以處理大型檔而且具有很快的分析速度。

    英文教程:https:// pandas.pydata.org/panda s-docs/stable/getting_started/10min.html

  • Matplotlib 包
  • 其實就是在python環境中的 MATLAB (科學制圖裏大神級的軟件),而且和它語法結構和用法大致相同。

    相當於上邊提到的ggplot2,只是一個執行與R環境一個是Python環境裏的視覺化工具包,這兩款看個人喜好來學習一個,另一個了解就好。

    英文教程:https:// matplotlib.org/

    生物學

  • 細胞生物學,翟中和
  • 當年考試時候用的書,對涉及的細胞的知識做了全方位的解釋。

  • 分子生物學,朱玉賢
  • 當年考試時候用的書,對這本書的理解,關系都後面對生信分析的理解。比如在數據分析中的基因組比對,轉錄本定量,單位點突變分析,測序裏的接頭,UMI,Barcode等等一些概念的理解。

  • 基因X,Lewin
  • 包含大量的文字和精美的配圖來極致詳盡的解釋生物學過程,唯一的缺點就是太厚。

    學習渠道(單純好用,不是廣告)

    生信菜鳥團 :適合生信初學者,包括常用軟件,格式,流程的教程,主要由文獻推薦,幫助新手快速進入生信狀態。

    生信技能樹 :包含論壇和公眾號,有高質素的推文,包括生信分析的方法,軟件教程,生信會議資訊,還有彩蛋和吐槽推文。

    生信人 :有生信文獻的推文,研究方法的教程

    宏基因組 :主要發微生物方面的推文,也包含生信分析的教程

    CSDN :https:// blog.csdn.net/u01126225 3

    簡書 :https://www. jianshu.com/u/edebc0f5f 8ba

    知乎專欄 :https:// zhuanlan.zhihu.com/c_18 7707704

    更新中...