摘要 | 第5-7页 |
Abstract | 第7-9页 |
第一章 绪论 | 第13-39页 |
1.1 宏基因组及宏基因组学 | 第13-16页 |
1.1.1 微生物与宏基因组 | 第13-14页 |
1.1.2 宏基因组学的研究策略 | 第14-16页 |
1.2 高通量测序技术 | 第16-19页 |
1.2.1 测序技术的发展 | 第16-18页 |
1.2.2 高通量测序技术在宏基因组中的应用 | 第18-19页 |
1.3 宏基因组测序数据分析方法 | 第19-24页 |
1.3.1 宏基因组分装 | 第19-21页 |
1.3.2 宏基因组样本比较或分类 | 第21-23页 |
1.3.3 宏基因组基因预测和功能注释 | 第23-24页 |
1.4 序列特征 | 第24-28页 |
1.4.1 序列统计特征 | 第25-26页 |
1.4.2 序列几何模型 | 第26-28页 |
1.5 基于序列特征的宏基因组数据分类的机器学习策略 | 第28-35页 |
1.5.1 机器学习策略 | 第28-30页 |
1.5.2 机器学习的分类学习算法 | 第30-35页 |
1.6 本课题的主要工作 | 第35-39页 |
1.6.1 课题研究动机 | 第35-36页 |
1.6.2 课题研究内容 | 第36-37页 |
1.6.3 课题意义 | 第37页 |
1.6.4 论文架构 | 第37-39页 |
第二章 ICO:寡核苷酸内关联度特征 | 第39-53页 |
2.1 绪论 | 第39页 |
2.2 ICO特征的原理及计算方法 | 第39-40页 |
2.3 ICO特征辨别微生物物种的性能分析 | 第40-51页 |
2.3.1 序列长度和基因组GC含量对ICO性能评估的影响 | 第40-42页 |
2.3.2 基于ICO特征向量图谱的分析 | 第42-43页 |
2.3.3 基于种内与种间距离差异的分析 | 第43-48页 |
2.3.4 基于种内和种间关联度的分析 | 第48-51页 |
2.4 本章小节 | 第51-53页 |
第三章 HSS-bin:一种基于序列特征的宏基因组无监督分装算法 | 第53-69页 |
3.1 绪论 | 第53-54页 |
3.2 方法和数据 | 第54-58页 |
3.2.1 算法流程 | 第54-55页 |
3.2.2 组合特征和特征向量的归一化 | 第55页 |
3.2.3 谱聚类算法 | 第55-56页 |
3.2.4 数据集 | 第56-57页 |
3.2.5 分装算法正确率的评估 | 第57-58页 |
3.3 基于不同序列特征的分装性能比较 | 第58-63页 |
3.3.1 基于单独序列特征的分装算法的性能比较 | 第58-62页 |
3.3.2 基于组合特征的分装算法的性能评估 | 第62-63页 |
3.4 应用谱聚类算法可以提升分装算法的性能 | 第63-65页 |
3.5 HSS-bin算法与其他分装算法的性能比较 | 第65-67页 |
3.6 本章小结 | 第67-69页 |
第四章 DectICO:一种有监督的宏基因组样本分类算法 | 第69-89页 |
4.1 绪论 | 第69-70页 |
4.2 方法和数据 | 第70-77页 |
4.2.1 算法原理 | 第70-72页 |
4.2.2 动态的KPLS特征筛选算法 | 第72-74页 |
4.2.3 样本特征向量的提取及归一化 | 第74-75页 |
4.2.4 评估实验 | 第75-76页 |
4.2.5 数据集 | 第76-77页 |
4.3 DectICO算法与基于多联核苷酸频率特征的样本分类算法的性能比较 | 第77-81页 |
4.3.1 基于长核苷酸的ICO特征分类性能优秀 | 第77-79页 |
4.3.2 DectICO算法的稳定性和通用性更好 | 第79-81页 |
4.4 动态的特征筛选算法提高了DectICO算法的分类性能 | 第81-82页 |
4.5 DectICO算法与基于RSVM的样本分类算法的性能比较 | 第82-86页 |
4.6 本章小结 | 第86-89页 |
第五章 总结与展望 | 第89-93页 |
5.1 论文总结与创新点 | 第89-91页 |
5.2 后期展望 | 第91-93页 |
参考文献 | 第93-107页 |
附录 | 第107-123页 |
附录A 第二章用于测试基因组片段长度和基因组GC含量对序列特征性能评估影响的物种基因组信息 | 第107-110页 |
附录B 第二章用于特征向量图谱、种内种间距离和种内种间关联度实验的物种信息 | 第110-113页 |
附录C 第二章补充的实验结果图示及表格 | 第113-117页 |
附录D 第三章用于模拟宏基因组数据集的微生物物种信息 | 第117-120页 |
附录E 第四章DectICO算法与基于寡核苷酸频率特征的分类算法在稳定性测试实验中20个分类器LOOCV正确率的差值 | 第120-123页 |
致谢 | 第123-125页 |
作者简介 | 第125页 |