中文摘要 | 第1-5页 |
Abstract | 第5-10页 |
绪论 | 第10-19页 |
·原核生物基因组 | 第10-11页 |
·生物信息学及其主要内容 | 第11-13页 |
·基因识别算法 | 第13-15页 |
·本论文的主要工作 | 第15-19页 |
第一章 DNA序列的Z曲线理论 | 第19-26页 |
·DNA序列的Z曲线理论 | 第19-21页 |
·Z曲线理论的应用 | 第21-26页 |
第二章 以核酸分布为基础对超嗜热嗜泉生古细菌Aeropyurm pernix K1基因组基因进行识别 | 第26-43页 |
·引言 | 第27-28页 |
·材料与方法 | 第28-29页 |
·数据库 | 第28页 |
·Z曲线方法 | 第28-29页 |
·结果与讨论 | 第29-43页 |
·三类现象和它的内在起因 | 第29-33页 |
·重新识别的蛋白质编码基因集 | 第33-39页 |
·聚到类B和类C中的ORFs的起源 | 第39页 |
·分析不同类ORFs的核酸组成 | 第39-40页 |
·当前方法的准确率 | 第40-41页 |
·和其他研究者重新注释的对比 | 第41页 |
·网络服务 | 第41-43页 |
第三章 细菌、古细菌基因识别程序ZCURVE1.0 | 第43-71页 |
·引言 | 第44-45页 |
·材料和方法 | 第45-57页 |
·寻找细菌或者古细菌基因组中所有的ORFs和种子ORF | 第49-50页 |
·基因识别的核心算法 | 第50-52页 |
·排除重叠ORFs的策略 | 第52-55页 |
·起始位点预测方法 | 第55-57页 |
·结果和讨论 | 第57-70页 |
·评价算法的指标 | 第57页 |
·与Glimmer2.02对比之一:所有注释的基因和功能已知的基因. | 第57-61页 |
·与Glimmer2.02对比之二:短基因和水平转移基因 | 第61-63页 |
·与Glimmer2.02对比之三:基因起始位点预测 | 第63-64页 |
·与Glimmer2.02对比之四:基因预测的伪正率 | 第64页 |
·对G+C含量超过56%的基因组寻找种子ORFs | 第64-66页 |
·高GC含量基因组9维空间的聚类及多次Fisher判别 | 第66-69页 |
·联合使用ZCURVE1.0和Glimmer2.02 | 第69-70页 |
·结论 | 第70-71页 |
第四章 ZUCRVE_V:一个新的自训练病毒、噬菌体基因识别程序 | 第71-93页 |
·引言 | 第72-73页 |
·材料和方法 | 第73-76页 |
·结果和讨论 | 第76-93页 |
·评价ZCURVE_V的指标 | 第76-77页 |
·和GeneMark对比之一:具有不同染色体长度的病毒基因组 | 第77-81页 |
·和GeneMark对比之二:具有专门特征的病毒基因组 | 第81-82页 |
·应用ZCURVE_V分析HIV-1、HBV和SARS-CoV基因组 | 第82-84页 |
·被RefSeq注释和GenBank注释错过的新基因 | 第84-85页 |
·翻译起始位点预测 | 第85页 |
·解释翻译起始位点预测方法的有效性 | 第85-87页 |
·可能的减少伪正预测的方法 | 第87-89页 |
·预测基因的功能和他们VZ分数之间的关系 | 第89-90页 |
·在匿名的病毒基因组注释过程中优先使用ZCURVE_V | 第90-91页 |
·ZCURVE_V和GeneMark基因识别家族的联合使用 | 第91-93页 |
第五章 Z曲线方法揭示的Chlamydia muridarum基因组的链特异性的偏差 | 第93-105页 |
·引言 | 第94-95页 |
·材料和方法 | 第95-97页 |
·数据库 | 第95页 |
·Z曲线 | 第95-96页 |
·相位特异性的Z曲线 | 第96页 |
·主成分分析 | 第96-97页 |
·K-means聚类方法 | 第97页 |
·结果和讨论 | 第97-105页 |
·u_1-u_9 的PCA揭示的链特异性的密码子使用偏差 | 第97-99页 |
·用u_1-u_9 的K-means聚类方法定量区分两条复制链上的的基因 | 第99-100页 |
·密码子使用的偏差 | 第100-102页 |
·为什么碱基(密码子)使用分离的现象只在特定的几个基因组中出现? | 第102-105页 |
第六章 高GC含量基因组ORFs碱基频率的分析 | 第105-115页 |
·引言 | 第106页 |
·数据库和方法 | 第106-107页 |
·结果和讨论 | 第107-114页 |
·结论 | 第114-115页 |
第七章 细菌基因翻译起始位点的预测 | 第115-126页 |
·引言 | 第115-116页 |
·材料与方法 | 第116-122页 |
·数据库 | 第116-117页 |
·方法 | 第117-121页 |
·自训练方法和种子ORFs | 第121-122页 |
·结果与讨论 | 第122-126页 |
·用可靠的数据集检验自训练方法 | 第122-124页 |
·作为基因识别程序的后处理器重新确定基因起始 | 第124-126页 |
总结论 | 第126-128页 |
参考文献 | 第128-141页 |
发表论文及参加科研情况说明 | 第141-142页 |
附录 | 第142-148页 |
致谢 | 第148页 |