摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第1章 绪论 | 第9-16页 |
1.1 引言 | 第9-10页 |
1.2 研究背景 | 第10页 |
1.3 国内外研究现状 | 第10-13页 |
1.4 本文主要研究内容 | 第13-14页 |
1.5 论文的组织结构 | 第14-16页 |
第2章 蛋白质翻译后修饰中常用的特征提取算法 | 第16-23页 |
2.1 引言 | 第16页 |
2.2 建立识别S-亚磺酰化的模型S-SulfPred用到的特征提取策略 | 第16-18页 |
2.3 构建预测羰基化的模型CarSite使用的编码策略 | 第18-19页 |
2.4 开发预测O-糖基化的模型O-GlcNAcPRED-Ⅱ用到的提取策略 | 第19-22页 |
2.5 本章小结 | 第22-23页 |
第3章 基于OSSU-SMOTEO重采样预测蛋白质S-亚磺酰化位点 | 第23-33页 |
3.1 引言 | 第23页 |
3.2 实验材料与方法 | 第23-27页 |
3.2.1 S-亚磺酰化数据收集与预处理 | 第23-25页 |
3.2.2 OSSU-SMOTEO重采样方法 | 第25-27页 |
3.2.3 构建预测模型S-SulfPred与性能评估 | 第27页 |
3.3 实验结果与讨论 | 第27-32页 |
3.3.1 氨基酸成分、OSSU-SMOTEO重采样方法平衡训练数据集 | 第27-28页 |
3.3.2 PSAAP和AAPPI混合编码提高预测性能 | 第28-29页 |
3.3.3 OSSU-SMOTEO重采样方法的有效性 | 第29-30页 |
3.3.4 S-SulfPred与其他预测模型比较 | 第30-32页 |
3.4 本章小结 | 第32-33页 |
第4章 基于单边选择下采样识别人类蛋白质羰基化位点 | 第33-42页 |
4.1 引言 | 第33页 |
4.2 实验材料与方法 | 第33-35页 |
4.2.1 羰基化数据收集与预处理 | 第33-34页 |
4.2.2 构建预测模型CarSite与性能评估 | 第34-35页 |
4.3 实验结果与讨论 | 第35-41页 |
4.3.1 CKSAAP特征选择、交叉验证评估预测模型CarSite | 第35-36页 |
4.3.2 PSAAP、CKSAAP、AAC和CHHAA混合编码提高预测性能 | 第36-37页 |
4.3.3 单边选择重采样方法的有效性 | 第37-39页 |
4.3.4 CarSite与其他预测模型对比 | 第39页 |
4.3.5 针对酵母蛋白质中的羰基化位点和CarSPred.Y对比 | 第39-41页 |
4.4 本章小结 | 第41-42页 |
第5章 基于KPCA-FUS重采样和旋转森林集成算法识别O-糖基化位点 | 第42-53页 |
5.1 引言 | 第42页 |
5.2 实验材料与方法 | 第42-47页 |
5.2.1 O-糖基化数据收集与预处理 | 第42-43页 |
5.2.2 KPCA-FUS重采样技术 | 第43-46页 |
5.2.3 集成学习算法、性能评估与训练样本预处理 | 第46-47页 |
5.3 实验结果与讨论 | 第47-52页 |
5.3.1 各种特征相互结合以优化预测模型 | 第47-49页 |
5.3.2 KPCA-FUS重采样方法的有效性 | 第49-50页 |
5.3.3 使用旋转森林集成学习算法提高预测性能 | 第50-51页 |
5.3.4 O-GlcNAcPRED-Ⅱ与其他预测模型对比 | 第51-52页 |
5.4 本章小结 | 第52-53页 |
第6章 总结与展望 | 第53-55页 |
6.1 本文工作总结 | 第53页 |
6.2 后续工作展望 | 第53-55页 |
参考文献 | 第55-61页 |
附录1 第3章相关表格 | 第61-64页 |
附录2 第5章相关表格 | 第64-65页 |
攻读学位期间公开发表论文 | 第65-66页 |
致谢 | 第66-67页 |
作者简介 | 第67页 |