摘要 | 第1-7页 |
ABSTRACT | 第7-11页 |
1 绪论 | 第11-18页 |
·蛋白质结构类预测的研究背景与研究意义 | 第11-13页 |
·研究背景 | 第11-12页 |
·研究意义 | 第12-13页 |
·常用的蛋白质数据库及数据集 | 第13-16页 |
·蛋白质数据库 | 第13-15页 |
·数据集 | 第15-16页 |
·论文的主要工作与安排 | 第16-18页 |
·本文研究的主要内容 | 第16-17页 |
·本文组织结构 | 第17-18页 |
2 蛋白质序列特征信息的提取 | 第18-33页 |
·引言 | 第18页 |
·蛋白质相关理论基础 | 第18-22页 |
·蛋白质的组成 | 第18-19页 |
·蛋白质物理化学性质 | 第19页 |
·蛋白质的结构层次和结构分类 | 第19-22页 |
·常见的蛋白质序列特征信息提取方法 | 第22-26页 |
·基于氨基酸组成和位置的特征提取方法 | 第22-24页 |
·基于氨基酸物理化学特性的特征提取方法 | 第24-26页 |
·基于蛋白质二级结构信息的特征提取方法 | 第26页 |
·其他特征提取方法 | 第26页 |
·本研究提出及采用的序列特征信息提取方法 | 第26-30页 |
·基于字统计模型的特征提取方法 | 第27页 |
·基于氨基酸片段位置分布的特征提取方法 | 第27-28页 |
·基于氨基酸保守属性的特征提取方法 | 第28-30页 |
·传统特征提取与本研究中特征提取方法的比较 | 第30-31页 |
·本章小结 | 第31-33页 |
3 蛋白质序列特征信息的选择 | 第33-44页 |
·引言 | 第33页 |
·常见的特征信息挑选方法 | 第33-37页 |
·主成分分析法 | 第34-35页 |
·随机森林算法 | 第35-37页 |
·蛋白质多重信息组合模型 | 第37页 |
·基于相对重要性的随机森林特征挑选 | 第37-40页 |
·特征挑选方法 | 第37-39页 |
·实验流程与参数设定 | 第39-40页 |
·实验结果与讨论 | 第40-42页 |
·特征挑选对分类性能的影响 | 第40页 |
·分类率比较 | 第40-42页 |
·特征信息选取结果 | 第42页 |
·本章小结 | 第42-44页 |
4 基于机器学习的蛋白质二级结构类预测研究 | 第44-57页 |
·引言 | 第44页 |
·常见的机器学习算法 | 第44-47页 |
·支持向量机 | 第44-45页 |
·神经网络方法 | 第45-46页 |
·k-近邻法 | 第46-47页 |
·基于单分类器及多分类器组合的蛋白质二级结构类预测实验 | 第47-49页 |
·单分类器的设计 | 第47-48页 |
·多分类器组合 | 第48页 |
·特征集选取 | 第48-49页 |
·实验结果与讨论 | 第49-55页 |
·评估方法和指标 | 第49-50页 |
·不同分类器结果的比较 | 第50-55页 |
·单分类器与多分类器组合结果的比较 | 第55页 |
·本章小结 | 第55-57页 |
5 总结与展望 | 第57-59页 |
致谢 | 第59-60页 |
参考文献 | 第60-66页 |
附录 | 第66页 |