首页--生物科学论文--生物化学论文--蛋白质论文

基于谱隐马尔可夫模型的蛋白质序列模体识别方法研究

摘要第4-6页
Abstract第6-7页
主要符号表第17-18页
1 绪论第18-36页
    1.1 研究背景及意义第18-24页
        1.1.1 机器学习在生物信息学中的应用第18页
        1.1.2 蛋白质序列模体识别概述第18-20页
        1.1.3 蛋白质序列模体识别的意义及难点第20-24页
    1.2 相关问题的研究现状第24-34页
        1.2.1 基于机器学习等计算方法的模体识别第24-27页
        1.2.2 基于Profile HMM的模体识别方法第27-33页
        1.2.3 蛋白质序列模体的可视化第33-34页
    1.3 本文的主要工作和结构安排第34-36页
2 数据分布不平衡的亚细胞靶向模体识别第36-68页
    2.1 引言第36页
    2.2 均衡采样方法第36-43页
        2.2.1 数据不平衡问题第36-37页
        2.2.2 基于AdaBoost的均衡采样法第37-40页
        2.2.3 结果与讨论第40-43页
    2.3 基于均衡采样的亚细胞靶向模体识别第43-58页
        2.3.1 蛋白质亚细胞定位第43-45页
        2.3.2 随机欠采样和基于模拟进化的过采样第45-46页
        2.3.3 基于Profile HMM和SVM的定位预测第46-48页
        2.3.4 结果与讨论第48-58页
    2.4 基于主动样本选择的亚细胞靶向模体识别第58-67页
        2.4.1 基于主动学习的合成序列选择第59-63页
        2.4.2 模体中的位置保守性分析第63页
        2.4.3 结果与讨论第63-67页
    2.5 本章小结第67-68页
3 基于Profile HMM选择性训练的多类型模体识别第68-88页
    3.1 引言第68页
    3.2 蛋白质序列数据预处理第68-69页
    3.3 基于区域覆盖和进化权重的whmm方法第69-74页
        3.3.1 覆盖残基的处理方法第69-71页
        3.3.2 Profile HMM的选择性训练第71-74页
    3.4 实验设计和分析方法第74-77页
        3.4.1 数据集采集和实验参数设置第74-75页
        3.4.2 残基水平和位点水平上的性能评价第75-77页
        3.4.3 不同表达的模体与已知模体的比较第77页
    3.5 结果与讨论第77-85页
        3.5.1 不同替换比例下whmm的性能第77-79页
        3.5.2 比较whmm与memefinder的性能第79-83页
        3.5.3 比较whmm与slimfinder的性能第83-85页
        3.5.4 不同方法在真实数据集上的表现第85页
    3.6 本章小结第85-88页
4 基于Profile HMM扩展训练的功能模体的变体识别第88-100页
    4.1 引言第88页
    4.2 蛋白质无序区域与模体的关联性分析第88-91页
        4.2.1 平均无序谱第88-89页
        4.2.2 模体在序列中位置的显著性分析第89-91页
    4.3 固有无序预测与Profile HMM的扩展训练第91-93页
        4.3.1 数据集采集第91页
        4.3.2 基于有序覆盖的集合扩展第91-92页
        4.3.3 实验设计和参数设置第92-93页
    4.4 结果与讨论第93-99页
        4.4.1 扩展训练集的最小规模对不同方法的影响第93-94页
        4.4.2 不同方法的平均性能第94页
        4.4.3 不同方法在单个模体上的性能第94-98页
        4.4.4 对比ghmm-augment和dhmm-augment第98-99页
    4.5 本章小结第99-100页
5 结论与展望第100-103页
    5.1 结论第100-101页
    5.2 创新点第101页
    5.3 展望第101-103页
参考文献第103-112页
附录A 第三章相关图表第112-120页
攻读博士学位期间科研项目及科研成果第120-121页
致谢第121-122页
作者简介第122页

论文共122页,点击 下载论文
上一篇:基于计算智能的时间序列模型及预测研究
下一篇:基于正则化方法的图像与图像序列恢复研究