當前位置: 華文問答 > 健康

機器學習/人工智能能否在生物制藥/生命科學界大展身手?

2016-03-10健康

藥物分子設計學的基本問題可以歸結為:

1、如果藥物分子可以視為一種分子機器,那麽需要找到組成此類分子機器的關鍵部件(稱為化學基元,chemotypes);

2、這類化學基元可以透過基於片段的藥物發現方法(Fragment-based drug discovery,FBDD)而確認,因此,需要高效合理地將這些片段設計組裝成候選藥物分子;

3、用虛擬和實體篩選的方法確證候選藥物分子的活性。這種被證明有活性且有明確的結構-活性關系 (Structure-activity relation, SAR) 的分子叫做先導化合物 (lead)。

在核磁共振和結構生物學等實驗方法的支持下,FBDD經歷了幾十年的發展已經成熟,有許多成功的案例。但是,如何把FBDD發現的分子片段組裝成完整的成藥性更好的分子仍然是尚未完全解決的問題。目前,分子片段組裝主要有片段生長、片段融合、和片段聯接方法。片段聯接方法在藥物設計實踐中套用較多,因為有很多可選擇的連結片段 (linkers) 而產生多樣化的分子,因此有更多的機會適配靶標的結合口袋。然而,發現這些連結片段的技術成為基於片段的分子組裝的關鍵。

理論上計算什麽樣的分子片段適合做連結片段是困難的,因此,嘗試透過機器學習的方法,從藥物化學數據中找出適合做連結片段的規律。

分子描述符和分子指紋

1.1 分子描述符和分子指紋概念

1.2 分子描述符類別和特點

1.3 分子指紋的類別和特點

2. 分子描述符/指紋計算軟件

2.1 分子表示方法和格式

2.1.1 SMILES,SMARTS,SDF, MOL, MOL2, PDB

2.1.2 JEM Editor, Chemdoodle, ChemAxon, ChemDraw, DrugBank

2.2 RDKit簡介及環境部署

2.3 RDKit中如何操作分子

2.4 RDKit中描述符的計算以及儲存

2.5 OpenBabel簡介及環境部署

2.6 OpenBabel操作分子和格式轉換

2.7 OpenBabel中的分子描述符和指紋

2.8 ChemDes計算分子描述符和

2.9 ChemDes計算分子指紋

2.10 ChemDes中的格式轉換

2.11 ChemDes中的分子最佳化

2.12 PyBioMed 簡介環境部署

2.13 PyBioMed 獲取分子

2.14 PyBioMed 計算分子描述符

2.15 PyBioMed 計算分子指紋

2.16 PyBioMed 計算蛋白質描述符

2.17PyBioMed 計算核酸描述符

2.18 PyBioMed 計算相互作用描述符

結構預處理和數據預處理

3.1 PyBioMed結構預處理

3.2 ChemSAR結構預處理

3.3 KNIME 結構預處理

3.4 Excel數據預處理及註意的問題

3.5 KNIME數據預處理

3.6 Pandas環境配置以及基本操作

3.6 sklearn數據預處理

3.7 歸一化與空值處理

演算法簡單介紹和分類

4.1 藥物設計中人工智能常用演算法簡介

4.2 常用演算法實作軟件或工具介紹

5. KNIME軟件介紹

5.1 KNIME軟件特色和界面

5.2 KNIME軟件構建基本計算任務

5.3 KNIME軟件社區支持

5.4 KNIME軟件客製化外掛程式

5.5 KNIME軟件第三方支持

特征選擇

6.1 基於sklearn的特征選擇

6.1.1 相關性分析,相關性繪圖

6.1.2 單變量特征選擇及選擇K個特征

6.1.3 遞迴式特征刪除

6.2 基於KNIME流程的特征選擇

6.2.1 相關性分析,相關性繪圖

6.2.2 單變量特征選擇

6.2.3 遞迴式特征刪除

7. 模型的評價與解釋

7.1 回歸模型和分類模型的評價指標

7.2 套用域的評估

7.3 基於樹的模型的解釋

ADMET介紹

8.1 ADMET概念以及意義

8.2 基於人工智能的ADMET虛擬評價方法的進展

8.3 ADMET計算資源(ADMETlab、ADMETsar等)

9. KNIME軟件構建ADMET模型

9.1 KNIME軟件配置相關外掛程式

9.2 caco-2細胞滲透性數據概覽

9.3 結構預處理

9.4 描述符和指紋計算

9.5 SVM模型構建以及參數調整

9.6 RF模型構架及參數調整

9.7 RNN模型構建以及簡單超參數調整

10. ADMET計算軟件和實操

10.1 ADMETlab(v1.0 與v2.0)計算平台使用

10.2 admetSAR計算平台使用

10.3 本地模型呼叫以及預測

雜訊過濾和相似性搜尋

11.1 FAFDrugs4過濾

11.2 指紋和相似性度量計算

11.3 Swiss-Similarity相似性搜尋

12. 機器學習模型構建和預測

12.1 收集GRK2化合物(講解過程)

12.2 計算合適的分子表征

12.3 演算法和特征選擇

12.4 模型構建和評價

12.5 套用模型篩選化合物庫

13. 分子對接

13.1 蛋白質預處理

13.2 小分子預處理

13.3 可套用Swiss-Dock對接

14. ADMET評估

14.1 ADMETlab計算並評估

14.2 確定相關性質的參考範圍

14.3 評估並確定Hits.