| 摘要 | 第1-6页 |
| Abstract | 第6-7页 |
| 第一章 引言 | 第7-11页 |
| 第二章 从序列分析出发研究蛋白质功能概况 | 第11-29页 |
| ·预测蛋白质功能的序列特征表述方法 | 第11-19页 |
| ·基于氨基酸组成及其相关信息的方法 | 第11-15页 |
| ·蛋白质功能域组成法 | 第15-16页 |
| ·基于基因组上下文的方法 | 第16-19页 |
| ·蛋白质序列分析中常用的机器学习算法 | 第19-29页 |
| ·支持向量机 | 第19-23页 |
| ·最近邻算法 | 第23-24页 |
| ·极大似然估计与期望最大化算法 | 第24-26页 |
| ·其它 | 第26-29页 |
| 第三章 生物医学文献挖掘概况 | 第29-34页 |
| ·生物医学文献数据库MEDLINE | 第29页 |
| ·自然语言处理 | 第29-30页 |
| ·生物自然语言处理 | 第30-34页 |
| 第四章 从蛋白质功能域组成对蛋白质四级结构的分类预测 | 第34-41页 |
| ·引言 | 第34-36页 |
| ·材料与方法 | 第36-38页 |
| ·数据集合 | 第36-37页 |
| ·功能域组成特征向量 | 第37页 |
| ·最近邻算法 | 第37-38页 |
| ·结果与讨论 | 第38-40页 |
| ·结论 | 第40-41页 |
| 第五章 运用支持向量机从蛋白质序列预测 rRNA、RNA和 DNA 结合蛋白质 | 第41-53页 |
| ·引言 | 第41-42页 |
| ·材料与方法 | 第42-45页 |
| ·数据集合 | 第42-43页 |
| ·支持向量机 | 第43-44页 |
| ·特征向量 | 第44-45页 |
| ·准确率评估 | 第45页 |
| ·结果 | 第45-47页 |
| ·讨论 | 第47-53页 |
| 第六章 基于功能域组成的蛋白质功能分类预测 | 第53-64页 |
| ·引言 | 第53-54页 |
| ·材料与方法 | 第54-57页 |
| ·数据集合与功能分类 | 第54-55页 |
| ·“简单”方法 | 第55-56页 |
| ·极大似然估计方法 | 第56-57页 |
| ·结果 | 第57-61页 |
| ·讨论 | 第61-64页 |
| 第七章 蛋白质功能域相互作用信息的文献挖掘及相关数据库构建 | 第64-80页 |
| ·引言 | 第64-66页 |
| ·材料与方法 | 第66-76页 |
| ·功能域相互作用的文本挖掘 | 第66-73页 |
| ·预测功能域-功能域相互作用 | 第73页 |
| ·DDIB数据库的构建 | 第73-76页 |
| ·DDIB数据库描述 | 第76-78页 |
| ·DDIB数据库的应用 | 第78-80页 |
| 第八章 SARS 冠状病毒spike 蛋白质中hAPN 受体结合位点的预测 | 第80-90页 |
| ·引言 | 第80-81页 |
| ·材料与方法 | 第81-85页 |
| ·蛋白质-蛋白质相互作用 | 第81-84页 |
| ·分子建模 | 第84页 |
| ·CD13三维模型的生成 | 第84-85页 |
| ·S蛋白质(D757-R761)对CD13(D438-P814)的相互作用模拟 | 第85页 |
| ·结果与讨论 | 第85-89页 |
| ·SARS_CoV蛋白质与CD13 可能的相互作用区域 | 第85-86页 |
| ·CD13(D438-P814)与SARS_CoV 的S 蛋白质(D757-R761)结合的三维模拟 | 第86-89页 |
| ·结论 | 第89-90页 |
| 第九章 结论与展望 | 第90-94页 |
| ·本文研究结论 | 第90-91页 |
| ·课题研究展望 | 第91-94页 |
| 参考文献 | 第94-106页 |
| 附录 | 第106-131页 |
| 附录1. 四级结构预测蛋白质集合 | 第106-126页 |
| ·非冗余训练集合中包含的蛋白质 | 第106-108页 |
| ·独立测试集合中包含的蛋白质 | 第108-126页 |
| 附录2. 核酸结合蛋白质集合 | 第126-131页 |
| ·rRNA结合蛋白质 | 第126-127页 |
| ·RNA结合蛋白质 | 第127页 |
| ·DNA结合蛋白质 | 第127-131页 |
| 攻读博士学位期间发表及完成的论文目录 | 第131-132页 |
| 致谢 | 第132页 |