中文摘要 | 第3-5页 |
Abstract | 第5-6页 |
第一章 引言 | 第10-22页 |
1.1 蛋白质序列和结构 | 第10页 |
1.2 氨基酸变异 | 第10-11页 |
1.3 复杂疾病与氨基酸变异 | 第11-12页 |
1.4 生物信息学方法预测氨基酸变异的影响 | 第12-19页 |
1.4.1 疾病相关变异信息数据库 | 第13-14页 |
1.4.2 蛋白质序列保守性 | 第14-15页 |
1.4.3 蛋白质结构和溶解性 | 第15-18页 |
1.4.4 机器学习方法和应用 | 第18-19页 |
1.5 本论文所要解决的问题 | 第19-20页 |
1.6 研究价值和意义 | 第20页 |
1.7 论文组织结构 | 第20-22页 |
第二章 氨基酸变异位点的保守性 | 第22-25页 |
2.1 三重保守性计算方法 | 第22-23页 |
2.2 氨基酸分类方式 | 第23-25页 |
第三章 氨基酸变异对蛋白质结构和溶解性的影响 | 第25-51页 |
3.1 预测氨基酸变异对蛋白质结构的影响 | 第25-35页 |
3.1.1 数据集 | 第25-27页 |
3.1.2 分类器的输入属性 | 第27-28页 |
3.1.3 二分类性能评价指标 | 第28-29页 |
3.1.4 SVM分类器的核函数选择 | 第29-31页 |
3.1.5 20重交叉验证性能和数据集大小的影响 | 第31-33页 |
3.1.6 盲测性能 | 第33-34页 |
3.1.7 讨论 | 第34-35页 |
3.2 预测氨基酸变异对于蛋白质溶解性的影响 | 第35-51页 |
3.2.1 数据采集和统计 | 第35-37页 |
3.2.2 输入属性 | 第37-39页 |
3.2.3 分类算法 | 第39页 |
3.2.4 属性筛选算法 | 第39-41页 |
3.2.5 多分类性能评价指标 | 第41页 |
3.2.6 基于筛选属性的两层随机森林分类算法 | 第41-43页 |
3.2.7 多重交叉验证和盲测 | 第43-45页 |
3.2.8 与其他预测方法比较 | 第45-51页 |
第四章 氨基酸变异分析算法与软件开发 | 第51-64页 |
4.1 变异位点的保守性分析算法和软件ProCon | 第51-59页 |
4.1.1 三重保守度算法及优化 | 第51-54页 |
4.1.2 ProCon功能和软件开发 | 第54-55页 |
4.1.3 ProCon使用 | 第55-59页 |
4.2 氨基酸变异对蛋白质溶解性影响预测软件PON-Sol | 第59-64页 |
4.2.1 PON-Sol功能和软件开发 | 第60-62页 |
4.2.2 PON-Sol应用:分析特定蛋白质中所有可能的氨基酸变异 | 第62-64页 |
第五章 氨基酸变异分析方法应用实例:神经退化疾病 | 第64-90页 |
5.1 神经退化疾病与基因突变 | 第64-66页 |
5.2 数据采集更新方法和LOVD 3.0 存储平台 | 第66-69页 |
5.3 变异数据分布和统计 | 第69-76页 |
5.3.1 疾病和对应基因、变异情况 | 第69-72页 |
5.3.2 氨基酸替换变异情况的统计分析 | 第72-76页 |
5.3.3 疾病和变异对应患者情况统计 | 第76页 |
5.4 氨基酸变异分析 | 第76-90页 |
5.4.1 分析方法 | 第76-77页 |
5.4.2 MC相关变异计算结果和讨论 | 第77-80页 |
5.4.3 DMD相关变异计算结果和讨论 | 第80-84页 |
5.4.4 HSAN相关变异计算结果和讨论 | 第84-86页 |
5.4.5 与多个疾病相关联的变异分析 | 第86-90页 |
第六章 结论与展望 | 第90-93页 |
6.1 工作总结 | 第90-91页 |
6.2 展望 | 第91-93页 |
参考文献 | 第93-103页 |
攻读学位期间公开发表的论文 | 第103-104页 |
附录 | 第104-117页 |
附录一、本文所收集的氨基酸变异影响蛋白质溶解性变化的原始数据 | 第104-115页 |
附录二、NDD疾病相关变异数据库中按人种分类的患者信息统计 | 第115-117页 |
致谢 | 第117-118页 |