摘要 | 第4-5页 |
abstract | 第5页 |
第1章 引言 | 第10-13页 |
1.1 琥珀酰化位点预测工具开发背景及意义 | 第10页 |
1.2 研究现状 | 第10-11页 |
1.3 主要研究内容及组织结构 | 第11-13页 |
1.3.1 主要研究内容 | 第11-12页 |
1.3.2 本文的组织结构 | 第12-13页 |
第2章 相关技术介绍 | 第13-24页 |
2.1 翻译后修饰数据库 | 第13-14页 |
2.1.1 Swiss—Prot数据库 | 第13-14页 |
2.1.2 PhosphoSitePlus数据库 | 第14页 |
2.1.3 CPLM数据库 | 第14页 |
2.2 Python | 第14-15页 |
2.3 R语言与机器学习 | 第15-21页 |
2.3.1 R语言的caret包 | 第16页 |
2.3.2 K临近算法 | 第16-17页 |
2.3.3 决策树算法 | 第17-19页 |
2.3.4 随机森林算法 | 第19页 |
2.3.5 GBM算法 | 第19-21页 |
2.4 Bootstrap前端框架 | 第21页 |
2.5 Apache服务器 | 第21-22页 |
2.6 PHP | 第22-23页 |
2.7 本章小结 | 第23-24页 |
第3章 工具需求分析 | 第24-28页 |
3.1 功能性需求 | 第24-26页 |
3.1.1 数据来源的权威性分析 | 第24-25页 |
3.1.2 工具的数据的冗余性分析 | 第25页 |
3.1.3 训练集提取特征的充分性 | 第25页 |
3.1.4 数据集的不平衡性分析 | 第25-26页 |
3.1.5 预测工具网站的建立 | 第26页 |
3.2 非功能性需求 | 第26页 |
3.3 本章小结 | 第26-28页 |
第4章 关键技术的设计与实现 | 第28-42页 |
4.1 预测平台建立 | 第28-29页 |
4.2 后台分类预测技术的架构设计 | 第29页 |
4.3 数据准备模块的实现 | 第29-31页 |
4.3.1 数据收集 | 第29-30页 |
4.3.2 数据处理 | 第30-31页 |
4.4 特征提取模块的实现 | 第31-35页 |
4.4.1 构建特征矩阵来提取特征 | 第32-33页 |
4.4.2 通过二进制编码来提取特征 | 第33页 |
4.4.3 特征选择 | 第33-35页 |
4.5 机器学习预测模块 | 第35-39页 |
4.5.1 机器学习分类预测评价标准 | 第35-36页 |
4.5.2 机器学习分类器预测 | 第36-39页 |
4.6 模型优化模块 | 第39-41页 |
4.6.1 数据集不平衡问题的优化 | 第39-41页 |
4.7 本章小结 | 第41-42页 |
第5章 预测工具的性能对比 | 第42-47页 |
5.1 同类工具介绍 | 第42-44页 |
5.1.1 iSuc-PseAAC预测工具 | 第42-43页 |
5.1.2 SuccFind预测工具 | 第43页 |
5.1.3 SuccinSite预测工具 | 第43-44页 |
5.2 与同类工具的预测性能的比较 | 第44-46页 |
5.2.1 独立测试集的选取 | 第44页 |
5.2.2 与iSuc-PseAAC工具和SuccFind预测工具进行比较 | 第44-45页 |
5.2.3 与SuccinSite预测工具进行比较 | 第45-46页 |
5.3 本章小结 | 第46-47页 |
第6章 预测工具的平台搭建及测试 | 第47-54页 |
6.1 预测工具平台的搭建 | 第47-48页 |
6.1.1 平台使用介绍 | 第47-48页 |
6.1.2 平台后台数据处理 | 第48页 |
6.2 测试原理及测试环境 | 第48-49页 |
6.2.1 测试原理 | 第48-49页 |
6.2.2 测试环境 | 第49页 |
6.3 测试用例 | 第49-52页 |
6.3.1 功能测试 | 第49-51页 |
6.3.2 模型预测评价指标测试 | 第51页 |
6.3.3 性能测试 | 第51-52页 |
6.3.4 稳定性测试 | 第52页 |
6.4 测试结果 | 第52页 |
6.5 本章小结 | 第52-54页 |
第7章 总结与展望 | 第54-56页 |
7.1 总结 | 第54页 |
7.2 展望 | 第54-56页 |
致谢 | 第56-57页 |
参考文献 | 第57-59页 |
攻读学位期间发表的学术论文及参加科研情况 | 第59-60页 |