摘要 | 第1-7页 |
ABSTRACT | 第7-12页 |
第一章 引言 | 第12-36页 |
·生物信息学简介 | 第12-18页 |
·核酸序列 | 第13-15页 |
·蛋白质序列 | 第15-18页 |
·生物序列比对 | 第18-28页 |
·生物序列比对的意义 | 第18-19页 |
·替换矩阵 | 第19-22页 |
·空位罚分函数 | 第22页 |
·比对的统计学显著性 | 第22-24页 |
·两序列比对算法 | 第24-28页 |
·点阵分析 | 第24-25页 |
·动态规划(DP)算法 | 第25-26页 |
·BLAST 算法 | 第26-28页 |
·序列聚类 | 第28-33页 |
·蛋白质序列聚类的意义 | 第28页 |
·蛋白质序列聚类的方法 | 第28-33页 |
·Protomap | 第29-30页 |
·ProClust | 第30-31页 |
·SYSTERS | 第31-32页 |
·CLUSS | 第32-33页 |
·Spectral clustering | 第33页 |
·本文的主要研究内容 | 第33-36页 |
第二章 多重序列比对 | 第36-51页 |
·引言 | 第36页 |
·常用算法 | 第36-44页 |
·Clustal W | 第38-39页 |
·Muscle | 第39页 |
·MAFFT | 第39-41页 |
·POA | 第41页 |
·T-Coffee | 第41-42页 |
·DIALIGN | 第42页 |
·ProbCons | 第42-43页 |
·Kalign | 第43-44页 |
·使用额外信息的比对算法 | 第44-47页 |
·SPEM | 第45页 |
·Expresso | 第45-46页 |
·Dbclustal | 第46页 |
·PROMALS | 第46-47页 |
·PRALINE | 第47页 |
·比对质量的评估 | 第47-49页 |
·比对的速度 | 第49页 |
·结论 | 第49-51页 |
第三章 基于迭代优化算法改进Kalign 比对质量 | 第51-59页 |
·算法 | 第52-56页 |
·相似性得分 | 第52-53页 |
·序列距离 | 第53页 |
·构建向导树 | 第53-55页 |
·迭代优化 | 第55-56页 |
·方法评估 | 第56-58页 |
·结论 | 第58-59页 |
第四章 一种快速多重序列比对算法 | 第59-73页 |
·比对算法 | 第60-65页 |
·距离的估计 | 第60-61页 |
·动态规划算法 | 第61-64页 |
·比对的参数 | 第64-65页 |
·测试及讨论 | 第65-72页 |
·运行时间 | 第65-69页 |
·比对质量 | 第69-70页 |
·内存的使用 | 第70-72页 |
·结论 | 第72-73页 |
第五章 基于新的距离度量聚类蛋白质序列 | 第73-87页 |
·距离计算方法 | 第73-76页 |
·距离计算方法的概述 | 第73-74页 |
·ISMS(Improved SMS,改进的SMS)算法 | 第74-76页 |
·AP 聚类算法 | 第76-77页 |
·测试数据集: | 第77-79页 |
·数据集A-COG 数据库 | 第78页 |
·数据集B-G 蛋白数据库 | 第78页 |
·数据集C-CAZy 数据库 | 第78-79页 |
·数据集 D-SCOP 数据库 | 第79页 |
·聚类性能的度量 | 第79-80页 |
·测试结果及讨论 | 第80-85页 |
·四个数据库的测试结果 | 第80-83页 |
·33 个(α/β)8 barrel 蛋白测试结果 | 第83-85页 |
·结论 | 第85-87页 |
第六章 基于后处理的AP 算法聚类蛋白质序列 | 第87-98页 |
·AP 算法的局限性分析 | 第87-89页 |
·基于AP 算法结果的后处理算法 | 第89-92页 |
·聚类结果分析 | 第92-97页 |
·结论 | 第97-98页 |
第七章 结论 | 第98-100页 |
·工作总结 | 第98-99页 |
·研究前景展望 | 第99-100页 |
致谢 | 第100-101页 |
参考文献 | 第101-111页 |
附录 | 第111-117页 |
1. 序列L-tuple 计数的方差的计算 | 第111-113页 |
2. 计算相似度得分的算法 | 第113-114页 |
3. AP 算法局限性的分析 | 第114-117页 |
攻博期间取得的研究成果 | 第117-118页 |