摘要 | 第1-8页 |
Abstract | 第8-10页 |
目录 | 第10-13页 |
第一章 绪论 | 第13-31页 |
第一节 生物信息学概述 | 第13-14页 |
第二节 生物信息学中的基础知识 | 第14-19页 |
·DNA和RNA分子 | 第14页 |
·蛋白质的结构和功能 | 第14-16页 |
·中心法则 | 第16-17页 |
·DNA结合蛋白 | 第17-19页 |
第三节 生物序列分析模型概述 | 第19-25页 |
·生物序列分析中的比对方法 | 第19-20页 |
·生物序列分析中的非比对方法 | 第20-25页 |
第四节 分类预测模型 | 第25-28页 |
·K-最邻近分类(K-Nearest Neighbor) | 第25-26页 |
·支持向量机(SVM) | 第26-28页 |
第五节 本论文的主要内容及结果 | 第28-31页 |
第二章 基于DNA结合蛋白质序列全面特征分析的分类预测模型 | 第31-51页 |
第一节 引言 | 第31-32页 |
第二节 材料和方法 | 第32-42页 |
·数据集 | 第32-33页 |
·DNA结合蛋白序列的全面特征信息表达 | 第33-42页 |
第三节 性能估计 | 第42-43页 |
第四节 特征选择方法 | 第43-45页 |
·最大相关性、最小冗余(mRMR)方法 | 第43-44页 |
·Wrappers方法 | 第44页 |
·基于mRMR和Wrappers(two-stage) | 第44-45页 |
第五节 结果和讨论 | 第45-50页 |
·特征选择方法的预测结果比较 | 第45-48页 |
·与现有方法的比较 | 第48-50页 |
第六节 小结 | 第50-51页 |
第三章 蛋白质序列相似性分析模型及其应用 | 第51-66页 |
第一节 引言 | 第51-52页 |
第二节 伪氨基酸组成方法 | 第52-55页 |
第三节 结果和讨论 | 第55-59页 |
第四节 基于伪氨基酸组成方法的DNA结合蛋白预测 | 第59-65页 |
·方法 | 第59-61页 |
·结果和讨论 | 第61-65页 |
第五节 小结 | 第65-66页 |
第四章 流感病毒H7N9 NA蛋白中位于蛋白表面的高保守区域 | 第66-81页 |
第一节 引言 | 第66-68页 |
·流感病毒的概述 | 第66-67页 |
·NA蛋白 | 第67-68页 |
第二节 方法 | 第68-76页 |
·DNA序列的图形表示方法 | 第68-69页 |
·蛋白质序列的图形表示方法 | 第69-74页 |
·NA蛋白的进化分析 | 第74-76页 |
·滑动窗口方法 | 第76页 |
第三节 结果和讨论 | 第76-80页 |
第四节 小结 | 第80-81页 |
第五章 结束语 | 第81-82页 |
附录 A | 第82-89页 |
参考文献 | 第89-100页 |
致谢 | 第100-101页 |
个人简历 在学期间发表的学术论文与研究成果 | 第101页 |