摘要 | 第1-6页 |
Abstract | 第6-7页 |
第一章 引言 | 第7-11页 |
第二章 从序列分析出发研究蛋白质功能概况 | 第11-29页 |
·预测蛋白质功能的序列特征表述方法 | 第11-19页 |
·基于氨基酸组成及其相关信息的方法 | 第11-15页 |
·蛋白质功能域组成法 | 第15-16页 |
·基于基因组上下文的方法 | 第16-19页 |
·蛋白质序列分析中常用的机器学习算法 | 第19-29页 |
·支持向量机 | 第19-23页 |
·最近邻算法 | 第23-24页 |
·极大似然估计与期望最大化算法 | 第24-26页 |
·其它 | 第26-29页 |
第三章 生物医学文献挖掘概况 | 第29-34页 |
·生物医学文献数据库MEDLINE | 第29页 |
·自然语言处理 | 第29-30页 |
·生物自然语言处理 | 第30-34页 |
第四章 从蛋白质功能域组成对蛋白质四级结构的分类预测 | 第34-41页 |
·引言 | 第34-36页 |
·材料与方法 | 第36-38页 |
·数据集合 | 第36-37页 |
·功能域组成特征向量 | 第37页 |
·最近邻算法 | 第37-38页 |
·结果与讨论 | 第38-40页 |
·结论 | 第40-41页 |
第五章 运用支持向量机从蛋白质序列预测 rRNA、RNA和 DNA 结合蛋白质 | 第41-53页 |
·引言 | 第41-42页 |
·材料与方法 | 第42-45页 |
·数据集合 | 第42-43页 |
·支持向量机 | 第43-44页 |
·特征向量 | 第44-45页 |
·准确率评估 | 第45页 |
·结果 | 第45-47页 |
·讨论 | 第47-53页 |
第六章 基于功能域组成的蛋白质功能分类预测 | 第53-64页 |
·引言 | 第53-54页 |
·材料与方法 | 第54-57页 |
·数据集合与功能分类 | 第54-55页 |
·“简单”方法 | 第55-56页 |
·极大似然估计方法 | 第56-57页 |
·结果 | 第57-61页 |
·讨论 | 第61-64页 |
第七章 蛋白质功能域相互作用信息的文献挖掘及相关数据库构建 | 第64-80页 |
·引言 | 第64-66页 |
·材料与方法 | 第66-76页 |
·功能域相互作用的文本挖掘 | 第66-73页 |
·预测功能域-功能域相互作用 | 第73页 |
·DDIB数据库的构建 | 第73-76页 |
·DDIB数据库描述 | 第76-78页 |
·DDIB数据库的应用 | 第78-80页 |
第八章 SARS 冠状病毒spike 蛋白质中hAPN 受体结合位点的预测 | 第80-90页 |
·引言 | 第80-81页 |
·材料与方法 | 第81-85页 |
·蛋白质-蛋白质相互作用 | 第81-84页 |
·分子建模 | 第84页 |
·CD13三维模型的生成 | 第84-85页 |
·S蛋白质(D757-R761)对CD13(D438-P814)的相互作用模拟 | 第85页 |
·结果与讨论 | 第85-89页 |
·SARS_CoV蛋白质与CD13 可能的相互作用区域 | 第85-86页 |
·CD13(D438-P814)与SARS_CoV 的S 蛋白质(D757-R761)结合的三维模拟 | 第86-89页 |
·结论 | 第89-90页 |
第九章 结论与展望 | 第90-94页 |
·本文研究结论 | 第90-91页 |
·课题研究展望 | 第91-94页 |
参考文献 | 第94-106页 |
附录 | 第106-131页 |
附录1. 四级结构预测蛋白质集合 | 第106-126页 |
·非冗余训练集合中包含的蛋白质 | 第106-108页 |
·独立测试集合中包含的蛋白质 | 第108-126页 |
附录2. 核酸结合蛋白质集合 | 第126-131页 |
·rRNA结合蛋白质 | 第126-127页 |
·RNA结合蛋白质 | 第127页 |
·DNA结合蛋白质 | 第127-131页 |
攻读博士学位期间发表及完成的论文目录 | 第131-132页 |
致谢 | 第132页 |