基于机器学习的蛋白质二级结构和相互作用预测
摘要 | 第1-6页 |
Abstract | 第6-14页 |
第1章 绪论 | 第14-32页 |
·课题研究的背景 | 第14-16页 |
·人类基因组计划和后基因组时代 | 第14页 |
·蛋白质组学 | 第14-16页 |
·课题研究的目的和意义 | 第16-17页 |
·研究现状 | 第17-28页 |
·蛋白质二级结构预测研究现状 | 第17-19页 |
·蛋白质相互作用预测研究现状 | 第19-24页 |
·蛋白质相互作用位点预测研究现状 | 第24-28页 |
·本文的研究内容 | 第28-31页 |
·研究内容概述 | 第28-29页 |
·本文的主要创新点 | 第29-31页 |
·本文的内容安排 | 第31-32页 |
第2章 基于模式词典的蛋白质二级结构预测 | 第32-54页 |
·引言 | 第32-33页 |
·蛋白质模式词典的构建 | 第33-42页 |
·模式的定义 | 第33-34页 |
·模式挖掘算法 | 第34-37页 |
·基于物种的蛋白质模式词典 | 第37-38页 |
·蛋白质模式词典的构建结果 | 第38-42页 |
·蛋白质模式词条和二级结构间的关系 | 第42-46页 |
·蛋白质模式词条的二级结构相似度 | 第42-43页 |
·影响蛋白质模式词条的二级结构的因素 | 第43-46页 |
·基于模式词典的蛋白质二级结构预测 | 第46-52页 |
·隐马尔可夫模型预测方法 | 第46-50页 |
·实验分析 | 第50-52页 |
·本章小节 | 第52-54页 |
第3章 基于样本可信度分析的蛋白质相互作用预测 | 第54-78页 |
·引言 | 第54-55页 |
·基于蛋白质域特征的相互作用预测 | 第55-57页 |
·蛋白质相互作用数据的可信度分析方法 | 第57-59页 |
·正例样本可信度 | 第57页 |
·反例样本的获取方式 | 第57-58页 |
·反例样本可信度 | 第58-59页 |
·蛋白质相互作用数据集的划分 | 第59-60页 |
·基于加权AR 模型的相互作用预测方法 | 第60-71页 |
·AR 模型的基本概念 | 第60-62页 |
·加权AR 模型 | 第62-65页 |
·蛋白质相互作用预测的性能评价 | 第65-66页 |
·实验分析 | 第66-71页 |
·加权的最大似然估计方法 | 第71-77页 |
·最大似然估计方法 | 第71-74页 |
·加权的最大似然估计方法 | 第74页 |
·实验分析 | 第74-77页 |
·本章小节 | 第77-78页 |
第4章 蛋白质相互作用预测的自学习方法 | 第78-90页 |
·引言 | 第78页 |
·半监督学习方法概述 | 第78-80页 |
·基于自训练学习方法的AR 模型 | 第80-82页 |
·在von Mering 数据集上的实验分析 | 第82-87页 |
·实验数据 | 第82页 |
·初始标记样本对模型性能的影响 | 第82-83页 |
·每次迭代选取样本的数量对模型性能的影响 | 第83-85页 |
·样本权重对模型预测性能的影响 | 第85-86页 |
·迭代过程中最佳模型的选择 | 第86-87页 |
·在DIP 数据集上的实验 | 第87-88页 |
·实验数据 | 第87页 |
·实验结果 | 第87-88页 |
·本章小节 | 第88-90页 |
第5章 基于条件随机域的蛋白质相互作用位点预测 | 第90-110页 |
·引言 | 第90-91页 |
·条件随机域模型概述 | 第91-93页 |
·基于条件随机域模型的蛋白质相互作用位点预测 | 第93-99页 |
·特征的定义 | 第94-98页 |
·条件随机域的实现 | 第98-99页 |
·实验数据的获得 | 第99-101页 |
·蛋白质链的选择 | 第99-100页 |
·表面残基的确定 | 第100页 |
·相互作用位点的选择 | 第100-101页 |
·平衡训练数据集 | 第101页 |
·实验分析 | 第101-109页 |
·评价标准 | 第101-102页 |
·实验设置 | 第102页 |
·在基本特征集上的预测性能比较 | 第102-104页 |
·训练数据的不平衡程度对预测性能的影响 | 第104-105页 |
·预测示例 | 第105-108页 |
·其他特征的尝试 | 第108-109页 |
·本章小节 | 第109-110页 |
结论 | 第110-112页 |
参考文献 | 第112-130页 |
攻读博士学位期间所发表的论文 | 第130-132页 |
致谢 | 第132-133页 |
个人简历 | 第133页 |