| 摘要 | 第1-7页 |
| ABSTRACT | 第7-13页 |
| 引言 | 第13-18页 |
| 第一章 距离保守性 | 第18-24页 |
| 第一节 距离保守性的发现 | 第18-22页 |
| ·引言 | 第18-19页 |
| ·数据准备 | 第19-20页 |
| ·数据集 | 第19页 |
| ·TFBS中的7-mers分类 | 第19-20页 |
| ·7-mer对距离保守性的发现 | 第20-22页 |
| 第二节 NT集搜索算法 | 第22-24页 |
| 第二章 7-mer集上的距离保守性检验 | 第24-32页 |
| 第一节 引言 | 第24-25页 |
| 第二节 距离保守的调节模体搜索(DCRMS)算法 | 第25-28页 |
| ·DCRMS算法的基本思想 | 第25页 |
| ·距离参数的定义 | 第25-26页 |
| ·二次判别分析(Quadratic Discriminant Analysis,QDA) | 第26-28页 |
| 第三节 距离保守的调节模体预测 | 第28-30页 |
| ·Ps和Nt集中的检验结果 | 第28页 |
| ·Pc集和Nf集中的预测结果 | 第28-30页 |
| 第四节 讨论 | 第30-32页 |
| ·k-mer对保守性机制的分析 | 第30-31页 |
| ·距离保守性的讨论 | 第31-32页 |
| 第三章 组织特异性模体对的距离保守性检验 | 第32-47页 |
| 第一节 人类组织特异模体对数据 | 第32-33页 |
| 第二节 人类组织特异模体对识别的参数定义 | 第33-35页 |
| ·距离分歧参数定义 | 第33页 |
| ·Fisher线性判别 | 第33-35页 |
| 第三节 距离分歧参数在28个组织中的统计 | 第35-38页 |
| ·距离分歧参数的统计 | 第35-38页 |
| 第四节 组织特异转录调节模体对的识别 | 第38-43页 |
| ·28个组织中的自洽检验 | 第38-40页 |
| ·人类组织特异性模体对的识别 | 第40-43页 |
| 第五节 讨论 | 第43-46页 |
| ·为什么选择7-mer? | 第43页 |
| ·随机涨落 | 第43页 |
| ·组织特异模体对注释 | 第43-46页 |
| 第六节 小结 | 第46-47页 |
| 第四章 IDQD算法 | 第47-56页 |
| 第一节 算法描述 | 第47-51页 |
| ·ID算法 | 第47-48页 |
| ·ID算法评价 | 第48-49页 |
| ·QD算法 | 第49-51页 |
| 第二节 讨论 | 第51-55页 |
| ·ID算法的理论基础——信息极大化原理 | 第51-53页 |
| ·信息极大化——信息生物学的一条基本原理 | 第51-52页 |
| ·信息极大化原理的证据 | 第52-53页 |
| ·QD中分类阈值ξ_0的确定 | 第53-55页 |
| 第三节 小结 | 第55-56页 |
| 第五章 人类基因组转录起始位点的预测 | 第56-71页 |
| 第一节 引言 | 第56-58页 |
| 第二节 数据集 | 第58-60页 |
| ·典型TSS预测数据集 | 第58-59页 |
| ·全基因组TSS预测数据集 | 第59-60页 |
| 第三节 ID参数定义 | 第60-62页 |
| 第四节 结果 | 第62-68页 |
| ·典型TSS预测结果 | 第62-65页 |
| ·全基因组TSS预测结果 | 第65-68页 |
| 第五节 讨论 | 第68-70页 |
| ·TSS识别中ID参数分析 | 第68-69页 |
| ·关于可变启动子 | 第69页 |
| ·染色质重塑与转录起始 | 第69-70页 |
| 第六节 小结 | 第70-71页 |
| 参考文献 | 第71-81页 |
| 附录1 附表 | 第81-89页 |
| 附录2 附图 | 第89-91页 |
| 致谢 | 第91-93页 |
| 作者论文目录 | 第93页 |