摘要 | 第5-7页 |
Abstract | 第7-8页 |
第一章 绪论 | 第9-20页 |
1.1 测序技术的产生和进展 | 第9-14页 |
1.1.1 第一代测序技术的产生 | 第9页 |
1.1.2 第二代测序技术的产生 | 第9-14页 |
1.2 第二代测序目前的主要应用 | 第14-17页 |
1.2.1 第二代测序在检测全基因组加倍中的应用 | 第14-15页 |
1.2.2 第二代测序在转录组学中的应用 | 第15-16页 |
1.2.3 第二代测序在环境基因组学中的应用 | 第16-17页 |
1.2.4 第二代测序在其他方面的应用 | 第17页 |
1.3 本研究的目的和意义 | 第17-20页 |
第二章 被子植物中多倍化事件是普遍存在的 | 第20-62页 |
2.1 背景介绍 | 第20-24页 |
2.1.1 全基因组多倍化的定义和意义 | 第20-21页 |
2.1.2 全基因组加倍的普遍性 | 第21-23页 |
2.1.3 被子植物的重要地位 | 第23-24页 |
2.2 数据和方法 | 第24-29页 |
2.2.1 全基因组测序物种的收集和转录组物种的测序 | 第24页 |
2.2.2 转录组测序,拼接以及蛋白质预测 | 第24-25页 |
2.2.3 基因家族的识别和基因树的构建 | 第25页 |
2.2.4 同义替换速率的计算(Ks)和混合模型拟合 | 第25-26页 |
2.2.5 全基因组加倍事件的发现 | 第26-28页 |
2.2.6 保留基因的GO(Gene Ontology)功能分析 | 第28-29页 |
2.3 基于Ks的方法验证已经发现的和识别新的全基因组加倍事件 | 第29-30页 |
2.3.1 已知全基因组加倍事件的验证 | 第29-30页 |
2.3.2 多个新全基因组加倍事件的发现 | 第30页 |
2.4 基于系统发生树的方式来发现和定位全基因组加倍事件 | 第30-36页 |
2.4.1 蔷薇类植物全基因组加倍事件 | 第30-32页 |
2.4.2 菊类植物全基因组加倍事件 | 第32-33页 |
2.4.3 单子叶植物全基因组加倍事件 | 第33-35页 |
2.4.4 木兰类及金鱼藻,金粟兰植物全基因组加倍事件 | 第35-36页 |
2.5 保留的重复基因的功能偏好性分析 | 第36-40页 |
2.5.1 十字花科的alpha(α)和beta(β)重复以后的保留的重复基因 | 第36-37页 |
2.5.2 豆科祖先基因组重复后保留基因的功能分析 | 第37-39页 |
2.5.3 禾本科的两次重复后保留的重复基因 | 第39-40页 |
2.6 gamma(γ)事件以后不同分支的丢失比较 | 第40-46页 |
2.7 本章小结 | 第46-48页 |
2.8 附图和附表 | 第48-62页 |
第三章 拟南芥早期花发育转录组中可变剪切分析 | 第62-101页 |
3.1 背景介绍 | 第62-64页 |
3.1.1 可变剪切研究的历史 | 第62页 |
3.1.2 可变剪切的主要形式 | 第62-63页 |
3.1.3 植物中的可变剪切 | 第63-64页 |
3.1.4 可变剪切的功能 | 第64页 |
3.2 材料与方法 | 第64-66页 |
3.2.1 拟南芥早期花转录组的收集,RNA提取和测序 | 第64-65页 |
3.2.2 测序片段比对和转录本拼接,表达量估计 | 第65页 |
3.2.3 可变剪切基因识别 | 第65页 |
3.2.4 寻找差异表达的可变剪切基因 | 第65-66页 |
3.2.5 差异表达基因的聚类和功能分析 | 第66页 |
3.2.6 未注释转录区域的识别 | 第66页 |
3.3 拟南芥早期花发育转录组的描述 | 第66-68页 |
3.4 表达量的估计 | 第68-69页 |
3.5 可变剪切事件的识别 | 第69-70页 |
3.6 不同发育时期差异表达的可变剪切基因 | 第70-73页 |
3.6.1 差异表达可变剪切基因的聚类分析 | 第70-72页 |
3.6.2 时期特异的可变剪切基因 | 第72-73页 |
3.7 新的转录区域的识别 | 第73-75页 |
3.7.1 序列拼装Cufflinks识别新的转录区域 | 第73-75页 |
3.8 本章小结 | 第75-78页 |
3.9 附图和附表 | 第78-101页 |
第四章 基于二代测序和组分特征的宏基因组学的研究方法 | 第101-142页 |
4.1 背景介绍 | 第101-102页 |
4.2 材料和方法流程 | 第102-105页 |
4.2.1 下载已有的细菌和真菌微生物的蛋白质组 | 第102页 |
4.2.2 构建参考基因的K串数据库 | 第102-103页 |
4.2.3 比较目标短串和参考基因数据库 | 第103页 |
4.2.4 对目标短串进行分类注释和功能注释 | 第103-104页 |
4.2.5 构建154个属中的不同长度的短串序列模拟数据 | 第104页 |
4.2.6 构建428个物种的不同长度的短串序列模拟数据 | 第104页 |
4.2.7 124个人类的肠道环境基因组 | 第104-105页 |
4.3 比较MetaCV与其他三种方法的敏感度和特异性(模拟数据一) | 第105-109页 |
4.4 比较MetaCV与其他三种方法在随机数据集中的表现(模拟数据二) | 第109-110页 |
4.5 评价MetaCV对于环境其他真核生物的污染的稳定性 | 第110-111页 |
4.6 利用MetaCV可以快速处理海量真实人类肠道的环境基因组数据 | 第111-114页 |
4.7 本章小结 | 第114-116页 |
4.8 附图和附表 | 第116-142页 |
参考文献 | 第142-150页 |
致谢 | 第150-153页 |
攻读博士期间所获奖励 | 第153-154页 |
攻读博士学位期间(待)发表的学术论文 | 第154-155页 |
博士期间给下列杂志审过稿件 | 第155-156页 |