摘要 | 第1-3页 |
ABSTRACT | 第3-7页 |
第一章 绪论 | 第7-14页 |
·生物信息学及其主要内容 | 第7-9页 |
·原核生物基因组和原核生物基因识别 | 第9-10页 |
·与本论文相关的生物学知识 | 第10-12页 |
·本论文的主要工作 | 第12-14页 |
第二章 蜡状芽孢杆菌ATCC 10987 基因组蛋白质编码基因的重新注释与分析 | 第14-22页 |
·引言 | 第14-15页 |
·材料与方法 | 第15-17页 |
·原始数据分析 | 第15-17页 |
·生物信息学方法 | 第17页 |
·结果与讨论 | 第17-20页 |
·结论 | 第20页 |
·补充材料 | 第20-22页 |
第三章 蛋白质编码基因注释文件的解读 | 第22-26页 |
·引言 | 第22-23页 |
·方法与结果 | 第23-26页 |
·注释基因分布特征统计 | 第23-24页 |
·注释基因异常状况统计 | 第24-26页 |
第四章 原核生物基因识别程序Zcurve 2.0 的研发 | 第26-40页 |
·引言 | 第26-27页 |
·DNA 序列的Z 曲线理论 | 第27-30页 |
·支持向量机方法 | 第30-34页 |
·算法简介 | 第31-33页 |
·SVM 在生物信息学中的应用 | 第33-34页 |
·程序组成 | 第34-40页 |
·寻找种子ORFs 和候选ORFs | 第36页 |
·核心算法 | 第36-38页 |
·排除重叠ORFs 的策略 | 第38-40页 |
第五章 Zcurve 2.0 基因识别能力的评价及讨论 | 第40-44页 |
·评价方法 | 第40-41页 |
·Zcurve 2.0 与Zcurve 1.02、Glimmer 3.02 的比较 | 第41-44页 |
·对比之一:300 bp 以上的注释基因 | 第41-42页 |
·对比之二:300 bp 以上的功能已知基因或保守基因 | 第42-43页 |
·其它说明 | 第43-44页 |
第六章 Z 曲线数据库与必需基因数据库的更新 | 第44-47页 |
·Z 曲线数据库的更新 | 第44-45页 |
·必需基因数据库的更新 | 第45-47页 |
参考文献 | 第47-53页 |
发表论文和参加科研情况说明 | 第53-54页 |
附录 | 第54-90页 |
致谢 | 第90页 |