当前位置: 华文问答 > 健康

机器学习/人工智能能否在生物制药/生命科学界大展身手?

2016-03-10健康

药物分子设计学的基本问题可以归结为:

1、如果药物分子可以视为一种分子机器,那么需要找到组成此类分子机器的关键部件(称为化学基元,chemotypes);

2、这类化学基元可以通过基于片段的药物发现方法(Fragment-based drug discovery,FBDD)而确认,因此,需要高效合理地将这些片段设计组装成候选药物分子;

3、用虚拟和实体筛选的方法确证候选药物分子的活性。这种被证明有活性且有明确的结构-活性关系 (Structure-activity relation, SAR) 的分子叫做先导化合物 (lead)。

在核磁共振和结构生物学等实验方法的支持下,FBDD经历了几十年的发展已经成熟,有许多成功的案例。但是,如何把FBDD发现的分子片段组装成完整的成药性更好的分子仍然是尚未完全解决的问题。目前,分子片段组装主要有片段生长、片段融合、和片段联接方法。片段联接方法在药物设计实践中应用较多,因为有很多可选择的链接片段 (linkers) 而产生多样化的分子,因此有更多的机会适配靶标的结合口袋。然而,发现这些链接片段的技术成为基于片段的分子组装的关键。

理论上计算什么样的分子片段适合做链接片段是困难的,因此,尝试通过机器学习的方法,从药物化学数据中找出适合做链接片段的规律。

分子描述符和分子指纹

1.1 分子描述符和分子指纹概念

1.2 分子描述符类别和特点

1.3 分子指纹的类别和特点

2. 分子描述符/指纹计算软件

2.1 分子表示方法和格式

2.1.1 SMILES,SMARTS,SDF, MOL, MOL2, PDB

2.1.2 JEM Editor, Chemdoodle, ChemAxon, ChemDraw, DrugBank

2.2 RDKit简介及环境部署

2.3 RDKit中如何操作分子

2.4 RDKit中描述符的计算以及存储

2.5 OpenBabel简介及环境部署

2.6 OpenBabel操作分子和格式转换

2.7 OpenBabel中的分子描述符和指纹

2.8 ChemDes计算分子描述符和

2.9 ChemDes计算分子指纹

2.10 ChemDes中的格式转换

2.11 ChemDes中的分子优化

2.12 PyBioMed 简介环境部署

2.13 PyBioMed 获取分子

2.14 PyBioMed 计算分子描述符

2.15 PyBioMed 计算分子指纹

2.16 PyBioMed 计算蛋白质描述符

2.17PyBioMed 计算核酸描述符

2.18 PyBioMed 计算相互作用描述符

结构预处理和数据预处理

3.1 PyBioMed结构预处理

3.2 ChemSAR结构预处理

3.3 KNIME 结构预处理

3.4 Excel数据预处理及注意的问题

3.5 KNIME数据预处理

3.6 Pandas环境配置以及基本操作

3.6 sklearn数据预处理

3.7 归一化与空值处理

算法简单介绍和分类

4.1 药物设计中人工智能常用算法简介

4.2 常用算法实现软件或工具介绍

5. KNIME软件介绍

5.1 KNIME软件特色和界面

5.2 KNIME软件构建基本计算任务

5.3 KNIME软件社区支持

5.4 KNIME软件定制化插件

5.5 KNIME软件第三方支持

特征选择

6.1 基于sklearn的特征选择

6.1.1 相关性分析,相关性绘图

6.1.2 单变量特征选择及选择K个特征

6.1.3 递归式特征删除

6.2 基于KNIME流程的特征选择

6.2.1 相关性分析,相关性绘图

6.2.2 单变量特征选择

6.2.3 递归式特征删除

7. 模型的评价与解释

7.1 回归模型和分类模型的评价指标

7.2 应用域的评估

7.3 基于树的模型的解释

ADMET介绍

8.1 ADMET概念以及意义

8.2 基于人工智能的ADMET虚拟评价方法的进展

8.3 ADMET计算资源(ADMETlab、ADMETsar等)

9. KNIME软件构建ADMET模型

9.1 KNIME软件配置相关插件

9.2 caco-2细胞渗透性数据概览

9.3 结构预处理

9.4 描述符和指纹计算

9.5 SVM模型构建以及参数调整

9.6 RF模型构架及参数调整

9.7 RNN模型构建以及简单超参数调整

10. ADMET计算软件和实操

10.1 ADMETlab(v1.0 与v2.0)计算平台使用

10.2 admetSAR计算平台使用

10.3 本地模型调用以及预测

噪声过滤和相似性搜索

11.1 FAFDrugs4过滤

11.2 指纹和相似性度量计算

11.3 Swiss-Similarity相似性搜索

12. 机器学习模型构建和预测

12.1 收集GRK2化合物(讲解过程)

12.2 计算合适的分子表征

12.3 算法和特征选择

12.4 模型构建和评价

12.5 应用模型筛选化合物库

13. 分子对接

13.1 蛋白质预处理

13.2 小分子预处理

13.3 可应用Swiss-Dock对接

14. ADMET评估

14.1 ADMETlab计算并评估

14.2 确定相关性质的参考范围

14.3 评估并确定Hits.