摘要 | 第3-5页 |
Abstract | 第5-6页 |
第一章 研究背景与方法介绍 | 第10-37页 |
1.1 蛋白质-RNA相互作用概述 | 第10-16页 |
1.1.1 RNA结合蛋白的特征 | 第11-12页 |
1.1.2 蛋白质-RNA相互作用的研究 | 第12-16页 |
1.2 本文所使用的特征描述符介绍 | 第16-23页 |
1.2.1 基于序列的蛋白质结构、物理化学性质表征 | 第17-20页 |
1.2.2 基于序列的遗传信息表征 | 第20页 |
1.2.3 基于结构的溶剂可及化表面积 | 第20-21页 |
1.2.4 基于结构的残基相互作用网络特征参数 | 第21-23页 |
1.3 本论文中应用的主要研究方法 | 第23-29页 |
1.3.1 特征选择方法 | 第23-24页 |
1.3.2 机器学习方法 | 第24-26页 |
1.3.3 集成学习方法 | 第26-28页 |
1.3.4 模型评价及验证 | 第28-29页 |
1.4 本论文的选题思路 | 第29-30页 |
参考文献 | 第30-37页 |
第二章 基于机器学习算法集成的RNA结合蛋白的预测研究 | 第37-47页 |
2.1 研究背景介绍 | 第37-38页 |
2.2 数据来源和方法 | 第38-40页 |
2.2.1 数据来源 | 第38-39页 |
2.2.2 特征描述 | 第39-40页 |
2.2.3 建模及验证 | 第40页 |
2.3 结果和讨论 | 第40-44页 |
2.3.1 训练集交互验证和测试集结果 | 第40-41页 |
2.3.2 特征分析 | 第41-43页 |
2.3.3 与其它方法的结果比较 | 第43-44页 |
2.4 结论 | 第44-45页 |
参考文献 | 第45-47页 |
第三章 基于序列和结构信息的RNA结合残基集成预测模型 | 第47-60页 |
3.1 研究背景介绍 | 第47-49页 |
3.2 数据来源和方法 | 第49-51页 |
3.2.1 数据来源 | 第49页 |
3.2.2 特征描述 | 第49-51页 |
3.2.3 建模及验证 | 第51页 |
3.3 结果和讨论 | 第51-56页 |
3.3.1 随机森林集成方法的预测结果 | 第51-53页 |
3.3.2 与其他方法的结果比较 | 第53-54页 |
3.3.3 重要特征分析 | 第54-56页 |
3.4 结论 | 第56-58页 |
参考文献 | 第58-60页 |
第四章 蛋白质-RNA相互作用界面的统计分析 | 第60-73页 |
4.1 研究背景介绍 | 第60-61页 |
4.2 数据来源和方法 | 第61-63页 |
4.2.1 数据来源 | 第61页 |
4.2.2 结合偏好性 | 第61-63页 |
4.2.3 残基保守性和网络特征分析 | 第63页 |
4.3 结果和讨论 | 第63-71页 |
4.3.1 蛋白质-RNA复合物中RNA结合残基的偏好性 | 第63-66页 |
4.3.2 蛋白质-RNA复合物中氨基酸-RNA结合对的偏好性 | 第66-68页 |
4.3.3 重要特征在RNA结合残基和非结合残基上的分布差异性 | 第68-71页 |
4.4 结论 | 第71-72页 |
参考文献 | 第72-73页 |
在学期间的研究成果 | 第73-74页 |
致谢 | 第74页 |