首页--生物科学论文--生物工程学(生物技术)论文--仿生学论文--生物信息论论文

基于序列特征的宏基因组数据分析方法研究

摘要第5-7页
Abstract第7-9页
第一章 绪论第13-39页
    1.1 宏基因组及宏基因组学第13-16页
        1.1.1 微生物与宏基因组第13-14页
        1.1.2 宏基因组学的研究策略第14-16页
    1.2 高通量测序技术第16-19页
        1.2.1 测序技术的发展第16-18页
        1.2.2 高通量测序技术在宏基因组中的应用第18-19页
    1.3 宏基因组测序数据分析方法第19-24页
        1.3.1 宏基因组分装第19-21页
        1.3.2 宏基因组样本比较或分类第21-23页
        1.3.3 宏基因组基因预测和功能注释第23-24页
    1.4 序列特征第24-28页
        1.4.1 序列统计特征第25-26页
        1.4.2 序列几何模型第26-28页
    1.5 基于序列特征的宏基因组数据分类的机器学习策略第28-35页
        1.5.1 机器学习策略第28-30页
        1.5.2 机器学习的分类学习算法第30-35页
    1.6 本课题的主要工作第35-39页
        1.6.1 课题研究动机第35-36页
        1.6.2 课题研究内容第36-37页
        1.6.3 课题意义第37页
        1.6.4 论文架构第37-39页
第二章 ICO:寡核苷酸内关联度特征第39-53页
    2.1 绪论第39页
    2.2 ICO特征的原理及计算方法第39-40页
    2.3 ICO特征辨别微生物物种的性能分析第40-51页
        2.3.1 序列长度和基因组GC含量对ICO性能评估的影响第40-42页
        2.3.2 基于ICO特征向量图谱的分析第42-43页
        2.3.3 基于种内与种间距离差异的分析第43-48页
        2.3.4 基于种内和种间关联度的分析第48-51页
    2.4 本章小节第51-53页
第三章 HSS-bin:一种基于序列特征的宏基因组无监督分装算法第53-69页
    3.1 绪论第53-54页
    3.2 方法和数据第54-58页
        3.2.1 算法流程第54-55页
        3.2.2 组合特征和特征向量的归一化第55页
        3.2.3 谱聚类算法第55-56页
        3.2.4 数据集第56-57页
        3.2.5 分装算法正确率的评估第57-58页
    3.3 基于不同序列特征的分装性能比较第58-63页
        3.3.1 基于单独序列特征的分装算法的性能比较第58-62页
        3.3.2 基于组合特征的分装算法的性能评估第62-63页
    3.4 应用谱聚类算法可以提升分装算法的性能第63-65页
    3.5 HSS-bin算法与其他分装算法的性能比较第65-67页
    3.6 本章小结第67-69页
第四章 DectICO:一种有监督的宏基因组样本分类算法第69-89页
    4.1 绪论第69-70页
    4.2 方法和数据第70-77页
        4.2.1 算法原理第70-72页
        4.2.2 动态的KPLS特征筛选算法第72-74页
        4.2.3 样本特征向量的提取及归一化第74-75页
        4.2.4 评估实验第75-76页
        4.2.5 数据集第76-77页
    4.3 DectICO算法与基于多联核苷酸频率特征的样本分类算法的性能比较第77-81页
        4.3.1 基于长核苷酸的ICO特征分类性能优秀第77-79页
        4.3.2 DectICO算法的稳定性和通用性更好第79-81页
    4.4 动态的特征筛选算法提高了DectICO算法的分类性能第81-82页
    4.5 DectICO算法与基于RSVM的样本分类算法的性能比较第82-86页
    4.6 本章小结第86-89页
第五章 总结与展望第89-93页
    5.1 论文总结与创新点第89-91页
    5.2 后期展望第91-93页
参考文献第93-107页
附录第107-123页
    附录A 第二章用于测试基因组片段长度和基因组GC含量对序列特征性能评估影响的物种基因组信息第107-110页
    附录B 第二章用于特征向量图谱、种内种间距离和种内种间关联度实验的物种信息第110-113页
    附录C 第二章补充的实验结果图示及表格第113-117页
    附录D 第三章用于模拟宏基因组数据集的微生物物种信息第117-120页
    附录E 第四章DectICO算法与基于寡核苷酸频率特征的分类算法在稳定性测试实验中20个分类器LOOCV正确率的差值第120-123页
致谢第123-125页
作者简介第125页

论文共125页,点击 下载论文
上一篇:加热炉助燃风机控制系统研究
下一篇:冷轧光整机板形控制系统研究与开发