摘要 | 第1-12页 |
Abstract | 第12-14页 |
第一章 绪论 | 第14-28页 |
·引言 | 第14-16页 |
·蛋白质功能预测的形式化描述 | 第16-17页 |
·蛋白质功能预测研究现状 | 第17-22页 |
·基于实验的预测 | 第17-18页 |
·基于网络的预测 | 第18-22页 |
·基于分类的预测 | 第22页 |
·基于分类的蛋白功能预测的研究意义和挑战 | 第22-25页 |
·研究意义 | 第22-23页 |
·面临的挑战 | 第23-25页 |
·论文的主要工作和结构 | 第25-28页 |
·论文的主要工作 | 第25-26页 |
·论文结构 | 第26-28页 |
第二章 分类技术 | 第28-44页 |
·分类学习基础 | 第28-29页 |
·二元分类 | 第29-33页 |
·统计学习模型 | 第29-31页 |
·支持向量机 | 第31-33页 |
·一些典型的分类问题 | 第33-37页 |
·不平衡数据分类 | 第34-35页 |
·半监督分类 | 第35-36页 |
·多类分类 | 第36-37页 |
·多标签分类 | 第37页 |
·分类技术在生物信息学中的应用 | 第37-39页 |
·蛋白质远程同源检测 | 第37-38页 |
·基因和蛋白的分类 | 第38页 |
·DNA 或蛋白质序列上特殊位点的预测 | 第38页 |
·微阵列基因表达分析 | 第38-39页 |
·基于分类的蛋白质功能预测基础 | 第39-44页 |
·数据集及预处理 | 第39-40页 |
·性能评估 | 第40-42页 |
·实验环境 | 第42-44页 |
第三章 蛋白质功能预测的核方法 | 第44-60页 |
·引言 | 第44-45页 |
·核方法 | 第45-49页 |
·核函数 | 第45-47页 |
·核的性质 | 第47页 |
·几个典型的核 | 第47-49页 |
·监督学习的核方法 | 第49-51页 |
·支持向量分类 | 第50页 |
·回归估计 | 第50-51页 |
·基于GO 和注释的核 | 第51-56页 |
·GO 词条的语义相似 | 第51-52页 |
·蛋白质相似矩阵 | 第52-53页 |
·蛋白质相似图的扩散核 | 第53页 |
·蛋白质相似图的优化扩散核 | 第53-56页 |
·实验分析 | 第56-59页 |
·数据源 | 第56-57页 |
·不同阈值δ的ROC 比较 | 第57页 |
·优化核与普通扩散核的ROC 比较 | 第57-58页 |
·优化扩散核与Lanckriet 核的ROC 比较 | 第58页 |
·公共最优扩散核的性能 | 第58-59页 |
·本章小结 | 第59-60页 |
第四章 基于不平衡数据的分类预测 | 第60-76页 |
·引言 | 第60-61页 |
·不平衡问题的本质 | 第61-62页 |
·不平衡类分布 | 第61页 |
·小的样本容量 | 第61页 |
·类的可分离性 | 第61页 |
·类内概念 | 第61-62页 |
·标准分类器的学习困难 | 第62-64页 |
·决策树 | 第62页 |
·反向传播神经网络 | 第62-63页 |
·贝叶斯分类 | 第63页 |
·支持向量机 | 第63页 |
·关联分类 | 第63-64页 |
·k-最近邻 | 第64页 |
·不平衡问题解决方案 | 第64-67页 |
·数据层次的方法 | 第64-65页 |
·算法层次的方法 | 第65页 |
·代价敏感的学习 | 第65-66页 |
·Boosting 方法 | 第66-67页 |
·功能预测算法SPE_RNE | 第67-72页 |
·创建人工正例扩大正例集 | 第67-69页 |
·抽取适当大小的代表负例集 | 第69-72页 |
·训练SVM 预测基因功能 | 第72页 |
·实验结果 | 第72-74页 |
·已知基因集的性能比较 | 第72-73页 |
·未知基因集的性能比较 | 第73-74页 |
·对未知基因的预测结果 | 第74页 |
·本章小结 | 第74-76页 |
第五章 基于半监督学习的分类预测 | 第76-92页 |
·引言 | 第76页 |
·半监督分类学习基础 | 第76-78页 |
·半监督分类学习方法 | 第78-83页 |
·混合模型 | 第78页 |
·自我训练 | 第78-79页 |
·协同训练与多视图算法 | 第79-80页 |
·正则与基于图的算法 | 第80-83页 |
·基于tri-training 的蛋白质功能预测 | 第83-87页 |
·抽取潜在的可靠正例 | 第83-84页 |
·识别可靠负例 | 第84-85页 |
·使用tri-training 训练和预测 | 第85-87页 |
·实验分析 | 第87-91页 |
·训练数据的维度缩减 | 第87-88页 |
·训练集上十倍交叉验证的结果 | 第88-89页 |
·已知基因集上的预测性能 | 第89-90页 |
·未知基因集上的预测性能 | 第90-91页 |
·本章小结 | 第91-92页 |
第六章 蛋白质功能的层次多标签预测 | 第92-104页 |
·引言 | 第92页 |
·多标签分类概述 | 第92-95页 |
·问题转换法 | 第93-94页 |
·算法改编法 | 第94-95页 |
·可扩展性问题 | 第95-96页 |
·蛋白质功能的层次预测 | 第96-99页 |
·SVM 集成的层次框架 | 第96-97页 |
·训练集的选择策略 | 第97-98页 |
·动态阈值策略 | 第98-99页 |
·实验分析 | 第99-102页 |
·数据集 | 第99-100页 |
·层次性能评估 | 第100页 |
·比较训练集的选择策略 | 第100页 |
·动态与固定阈值性能比较 | 第100-102页 |
·本章小结 | 第102-104页 |
第七章 结论与展望 | 第104-108页 |
·论文工作总结 | 第104-105页 |
·课题研究展望 | 第105-108页 |
致谢 | 第108-110页 |
参考文献 | 第110-126页 |
作者在学期间取得的学术成果 | 第126-128页 |
作者在学期间参加的主要科研工作 | 第128页 |