| 摘要 | 第1-7页 |
| ABSTRACT | 第7-11页 |
| 1 绪论 | 第11-18页 |
| ·蛋白质结构类预测的研究背景与研究意义 | 第11-13页 |
| ·研究背景 | 第11-12页 |
| ·研究意义 | 第12-13页 |
| ·常用的蛋白质数据库及数据集 | 第13-16页 |
| ·蛋白质数据库 | 第13-15页 |
| ·数据集 | 第15-16页 |
| ·论文的主要工作与安排 | 第16-18页 |
| ·本文研究的主要内容 | 第16-17页 |
| ·本文组织结构 | 第17-18页 |
| 2 蛋白质序列特征信息的提取 | 第18-33页 |
| ·引言 | 第18页 |
| ·蛋白质相关理论基础 | 第18-22页 |
| ·蛋白质的组成 | 第18-19页 |
| ·蛋白质物理化学性质 | 第19页 |
| ·蛋白质的结构层次和结构分类 | 第19-22页 |
| ·常见的蛋白质序列特征信息提取方法 | 第22-26页 |
| ·基于氨基酸组成和位置的特征提取方法 | 第22-24页 |
| ·基于氨基酸物理化学特性的特征提取方法 | 第24-26页 |
| ·基于蛋白质二级结构信息的特征提取方法 | 第26页 |
| ·其他特征提取方法 | 第26页 |
| ·本研究提出及采用的序列特征信息提取方法 | 第26-30页 |
| ·基于字统计模型的特征提取方法 | 第27页 |
| ·基于氨基酸片段位置分布的特征提取方法 | 第27-28页 |
| ·基于氨基酸保守属性的特征提取方法 | 第28-30页 |
| ·传统特征提取与本研究中特征提取方法的比较 | 第30-31页 |
| ·本章小结 | 第31-33页 |
| 3 蛋白质序列特征信息的选择 | 第33-44页 |
| ·引言 | 第33页 |
| ·常见的特征信息挑选方法 | 第33-37页 |
| ·主成分分析法 | 第34-35页 |
| ·随机森林算法 | 第35-37页 |
| ·蛋白质多重信息组合模型 | 第37页 |
| ·基于相对重要性的随机森林特征挑选 | 第37-40页 |
| ·特征挑选方法 | 第37-39页 |
| ·实验流程与参数设定 | 第39-40页 |
| ·实验结果与讨论 | 第40-42页 |
| ·特征挑选对分类性能的影响 | 第40页 |
| ·分类率比较 | 第40-42页 |
| ·特征信息选取结果 | 第42页 |
| ·本章小结 | 第42-44页 |
| 4 基于机器学习的蛋白质二级结构类预测研究 | 第44-57页 |
| ·引言 | 第44页 |
| ·常见的机器学习算法 | 第44-47页 |
| ·支持向量机 | 第44-45页 |
| ·神经网络方法 | 第45-46页 |
| ·k-近邻法 | 第46-47页 |
| ·基于单分类器及多分类器组合的蛋白质二级结构类预测实验 | 第47-49页 |
| ·单分类器的设计 | 第47-48页 |
| ·多分类器组合 | 第48页 |
| ·特征集选取 | 第48-49页 |
| ·实验结果与讨论 | 第49-55页 |
| ·评估方法和指标 | 第49-50页 |
| ·不同分类器结果的比较 | 第50-55页 |
| ·单分类器与多分类器组合结果的比较 | 第55页 |
| ·本章小结 | 第55-57页 |
| 5 总结与展望 | 第57-59页 |
| 致谢 | 第59-60页 |
| 参考文献 | 第60-66页 |
| 附录 | 第66页 |