基于蛋白质序列信息预测二硫键的新方法研究

摘要	第3-4页
Abstract	第4页
1 绪论	第9-13页
1.1 引言	第9页
1.2 研究背景	第9-11页
1.2.1 研究意义	第9-10页
1.2.2 研究现状	第10-11页
1.3 论文研究主要内容	第11页
1.4 论文结构安排	第11-13页
2 蛋白质序列数据处理	第13-27页
2.1 引言	第13页
2.2 蛋白质简介	第13-16页
2.2.1 蛋白质功能	第13-14页
2.2.2 蛋白质结构	第14-16页
2.3 数据来源	第16-18页
2.4 基于蛋白质数据的生物信息分析的蛋白质特征介绍	第18-26页
2.4.1 蛋白质数据分析	第18页
2.4.2 氨基酸残基特征	第18-21页
2.4.2.1 位置特异得分矩阵(PSSM)	第18-20页
2.4.2.2 预测的二级结构特征(PSS)	第20页
2.4.2.3 滑动窗口介绍	第20-21页
2.4.3 半胱氨酸对特征	第21-25页
2.4.3.1 半胱氨酸序列距离特征(DOC)	第21-22页
2.4.3.2 关联突变特征(CM)	第22-24页
2.4.3.3 半胱氨酸空间距离特征(PDBCR)	第24-25页
2.4.4 全局特征	第25-26页
2.4.4.1 氨基酸比例特征(AAC)	第25页
2.4.4.2 蛋白质分子质量(ProW)	第25页
2.4.4.3 蛋白质序列长度(ProL)	第25-26页
2.5 本章小结	第26-27页
3 特征选择	第27-33页
3.1 引言	第27页
3.2 特征选择介绍	第27-28页
3.3 传统选择方法	第28-29页
3.3.1 方差得分特征选择	第28页
3.3.2 拉普拉斯得分特征选择	第28-29页
3.3.3 费舍得分特征选择	第29页
3.4 相关性选择	第29-32页
3.5 本章小结	第32-33页
4 基于支持向量回归的二硫键连接模式预测模型	第33-42页
4.1 引言	第33页
4.2 预测模型建立	第33-41页
4.2.1 支持向量机	第34-37页
4.2.2 支持向量回归	第37-39页
4.2.3 随机森林	第39-40页
4.2.4 KNN	第40-41页
4.3 本章小结	第41-42页
5 蛋白质序列二硫键预测实验结果与分析	第42-57页
5.1 引言	第42页
5.2 性能评估	第42-44页
5.2.1 二硫键形成的模式预测方法	第42-43页
5.2.2 二硫键模式预测性能评估标准	第43页
5.2.3 4重交叉验证	第43-44页
5.3 实验结果与分析讨论	第44-53页
5.3.1 支持向量回归实验	第44-49页
5.3.1.1 不同特征组合对实验结果的影响	第44-45页
5.3.1.2 单变量特征选择对预测的影响	第45-46页
5.3.1.3 对费舍选择的分析	第46-47页
5.3.1.4 相关性特征选择对预测的影响	第47-48页
5.3.1.5 与支持向量分类比较	第48-49页
5.3.2 其它分类器下的预测结果	第49-50页
5.3.3 与其它实验结果比较	第50-52页
5.3.4 实验结果的显著性检验	第52-53页
5.4 预测系统展示	第53-55页
5.4.1 运行环境说明	第53页
5.4.2 系统介绍	第53-55页
5.5 本章小结	第55-57页
6 总结与展望	第57-59页
6.1 研究工作总结	第57页
6.2 未来的工作与展望	第57-59页
致谢	第59-60页
参考文献	第60-65页
附录	第65页