| 摘要 | 第1-12页 |
| Abstract | 第12-14页 |
| 第一章 绪论 | 第14-28页 |
| ·引言 | 第14-16页 |
| ·蛋白质功能预测的形式化描述 | 第16-17页 |
| ·蛋白质功能预测研究现状 | 第17-22页 |
| ·基于实验的预测 | 第17-18页 |
| ·基于网络的预测 | 第18-22页 |
| ·基于分类的预测 | 第22页 |
| ·基于分类的蛋白功能预测的研究意义和挑战 | 第22-25页 |
| ·研究意义 | 第22-23页 |
| ·面临的挑战 | 第23-25页 |
| ·论文的主要工作和结构 | 第25-28页 |
| ·论文的主要工作 | 第25-26页 |
| ·论文结构 | 第26-28页 |
| 第二章 分类技术 | 第28-44页 |
| ·分类学习基础 | 第28-29页 |
| ·二元分类 | 第29-33页 |
| ·统计学习模型 | 第29-31页 |
| ·支持向量机 | 第31-33页 |
| ·一些典型的分类问题 | 第33-37页 |
| ·不平衡数据分类 | 第34-35页 |
| ·半监督分类 | 第35-36页 |
| ·多类分类 | 第36-37页 |
| ·多标签分类 | 第37页 |
| ·分类技术在生物信息学中的应用 | 第37-39页 |
| ·蛋白质远程同源检测 | 第37-38页 |
| ·基因和蛋白的分类 | 第38页 |
| ·DNA 或蛋白质序列上特殊位点的预测 | 第38页 |
| ·微阵列基因表达分析 | 第38-39页 |
| ·基于分类的蛋白质功能预测基础 | 第39-44页 |
| ·数据集及预处理 | 第39-40页 |
| ·性能评估 | 第40-42页 |
| ·实验环境 | 第42-44页 |
| 第三章 蛋白质功能预测的核方法 | 第44-60页 |
| ·引言 | 第44-45页 |
| ·核方法 | 第45-49页 |
| ·核函数 | 第45-47页 |
| ·核的性质 | 第47页 |
| ·几个典型的核 | 第47-49页 |
| ·监督学习的核方法 | 第49-51页 |
| ·支持向量分类 | 第50页 |
| ·回归估计 | 第50-51页 |
| ·基于GO 和注释的核 | 第51-56页 |
| ·GO 词条的语义相似 | 第51-52页 |
| ·蛋白质相似矩阵 | 第52-53页 |
| ·蛋白质相似图的扩散核 | 第53页 |
| ·蛋白质相似图的优化扩散核 | 第53-56页 |
| ·实验分析 | 第56-59页 |
| ·数据源 | 第56-57页 |
| ·不同阈值δ的ROC 比较 | 第57页 |
| ·优化核与普通扩散核的ROC 比较 | 第57-58页 |
| ·优化扩散核与Lanckriet 核的ROC 比较 | 第58页 |
| ·公共最优扩散核的性能 | 第58-59页 |
| ·本章小结 | 第59-60页 |
| 第四章 基于不平衡数据的分类预测 | 第60-76页 |
| ·引言 | 第60-61页 |
| ·不平衡问题的本质 | 第61-62页 |
| ·不平衡类分布 | 第61页 |
| ·小的样本容量 | 第61页 |
| ·类的可分离性 | 第61页 |
| ·类内概念 | 第61-62页 |
| ·标准分类器的学习困难 | 第62-64页 |
| ·决策树 | 第62页 |
| ·反向传播神经网络 | 第62-63页 |
| ·贝叶斯分类 | 第63页 |
| ·支持向量机 | 第63页 |
| ·关联分类 | 第63-64页 |
| ·k-最近邻 | 第64页 |
| ·不平衡问题解决方案 | 第64-67页 |
| ·数据层次的方法 | 第64-65页 |
| ·算法层次的方法 | 第65页 |
| ·代价敏感的学习 | 第65-66页 |
| ·Boosting 方法 | 第66-67页 |
| ·功能预测算法SPE_RNE | 第67-72页 |
| ·创建人工正例扩大正例集 | 第67-69页 |
| ·抽取适当大小的代表负例集 | 第69-72页 |
| ·训练SVM 预测基因功能 | 第72页 |
| ·实验结果 | 第72-74页 |
| ·已知基因集的性能比较 | 第72-73页 |
| ·未知基因集的性能比较 | 第73-74页 |
| ·对未知基因的预测结果 | 第74页 |
| ·本章小结 | 第74-76页 |
| 第五章 基于半监督学习的分类预测 | 第76-92页 |
| ·引言 | 第76页 |
| ·半监督分类学习基础 | 第76-78页 |
| ·半监督分类学习方法 | 第78-83页 |
| ·混合模型 | 第78页 |
| ·自我训练 | 第78-79页 |
| ·协同训练与多视图算法 | 第79-80页 |
| ·正则与基于图的算法 | 第80-83页 |
| ·基于tri-training 的蛋白质功能预测 | 第83-87页 |
| ·抽取潜在的可靠正例 | 第83-84页 |
| ·识别可靠负例 | 第84-85页 |
| ·使用tri-training 训练和预测 | 第85-87页 |
| ·实验分析 | 第87-91页 |
| ·训练数据的维度缩减 | 第87-88页 |
| ·训练集上十倍交叉验证的结果 | 第88-89页 |
| ·已知基因集上的预测性能 | 第89-90页 |
| ·未知基因集上的预测性能 | 第90-91页 |
| ·本章小结 | 第91-92页 |
| 第六章 蛋白质功能的层次多标签预测 | 第92-104页 |
| ·引言 | 第92页 |
| ·多标签分类概述 | 第92-95页 |
| ·问题转换法 | 第93-94页 |
| ·算法改编法 | 第94-95页 |
| ·可扩展性问题 | 第95-96页 |
| ·蛋白质功能的层次预测 | 第96-99页 |
| ·SVM 集成的层次框架 | 第96-97页 |
| ·训练集的选择策略 | 第97-98页 |
| ·动态阈值策略 | 第98-99页 |
| ·实验分析 | 第99-102页 |
| ·数据集 | 第99-100页 |
| ·层次性能评估 | 第100页 |
| ·比较训练集的选择策略 | 第100页 |
| ·动态与固定阈值性能比较 | 第100-102页 |
| ·本章小结 | 第102-104页 |
| 第七章 结论与展望 | 第104-108页 |
| ·论文工作总结 | 第104-105页 |
| ·课题研究展望 | 第105-108页 |
| 致谢 | 第108-110页 |
| 参考文献 | 第110-126页 |
| 作者在学期间取得的学术成果 | 第126-128页 |
| 作者在学期间参加的主要科研工作 | 第128页 |