基于贝叶斯统计的基因非编码区与模体识别问题研究
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-9页 |
| 第一章 绪论 | 第9-21页 |
| ·研究背景和意义 | 第9-10页 |
| ·生物信息学的一些基础知识 | 第10-13页 |
| ·基因非编码区与模体识别问题的研究现状 | 第13-19页 |
| ·非编码区 | 第13-14页 |
| ·模体识别问题及其研究现状 | 第14-19页 |
| ·本文的研究内容及其结构安排 | 第19-21页 |
| 第二章 贝叶斯统计 | 第21-33页 |
| ·贝叶斯统计与生物信息学的关系 | 第21页 |
| ·贝叶斯统计原理 | 第21-22页 |
| ·先验分布与超参数 | 第22-28页 |
| ·先验分布及其选取方法 | 第22-27页 |
| ·超参数及其确定方法 | 第27-28页 |
| ·贝叶斯假设检验 | 第28-29页 |
| ·拟合优度检验 | 第29-32页 |
| ·小结 | 第32-33页 |
| 第三章 非编码DNA背景序列建模 | 第33-41页 |
| ·引言 | 第33-34页 |
| ·高阶马尔可夫背景模型的贝叶斯假设检验 | 第34-37页 |
| ·十组酵母非编码数据分析 | 第37-39页 |
| ·小结 | 第39-41页 |
| 第四章 生物序列中已识别模体的统计显著性分析 | 第41-51页 |
| ·引言 | 第41-42页 |
| ·模体的贝叶斯假设检验 | 第42-47页 |
| ·问题描述 | 第42页 |
| ·贝叶斯因子的构建 | 第42-45页 |
| ·超参数的两种估计 | 第45-47页 |
| ·结果与讨论 | 第47-49页 |
| ·评价指标 | 第47页 |
| ·真实数据分析 | 第47-48页 |
| ·模拟数据分析 | 第48-49页 |
| ·小结 | 第49-51页 |
| 第五章 模体的相似性统计分析 | 第51-65页 |
| ·引言 | 第51-52页 |
| ·相似模体的贝叶斯假设检验 | 第52-58页 |
| ·现有的模体的列比较函数 | 第52-55页 |
| ·基于贝叶斯假设检验的列与列的比较 | 第55-58页 |
| ·结果与讨论 | 第58-63页 |
| ·位置频数矩阵的核 | 第58页 |
| ·真实数据分析 | 第58-62页 |
| ·模拟数据分析 | 第62-63页 |
| ·小结 | 第63-65页 |
| 第六章 位置相关模体的建模与识别 | 第65-87页 |
| ·引言 | 第65-67页 |
| ·模体识别算法回顾 | 第65-66页 |
| ·Gibbs抽样算法 | 第66-67页 |
| ·基于贝叶斯得分函数的Gibbs抽样算法 | 第67-77页 |
| ·碱基二联体位置频数矩阵的构建 | 第67-68页 |
| ·背景模型 | 第68-69页 |
| ·贝叶斯得分函数的构建 | 第69-71页 |
| ·超参数的极大似然估计 | 第71-72页 |
| ·贪婪选择起始位点 | 第72-73页 |
| ·位点抽样 | 第73-75页 |
| ·相位移动 | 第75页 |
| ·多模体的识别 | 第75-76页 |
| ·GBS-MotifSAM算法描述 | 第76-77页 |
| ·算法时间复杂度分析 | 第77页 |
| ·结果与讨论 | 第77-85页 |
| ·评价指标 | 第77-79页 |
| ·真实数据分析 | 第79-84页 |
| ·模拟数据分析 | 第84-85页 |
| ·小结 | 第85-87页 |
| 结束语 | 第87-89页 |
| 附录A | 第89-93页 |
| 附录B | 第93-99页 |
| 致谢 | 第99-101页 |
| 参考文献 | 第101-109页 |
| 攻读博士学位期间的研究成果 | 第109-111页 |