首页--生物科学论文--生物化学论文--蛋白质论文

基于相似性比对改进KNN的蛋白质亚细胞定位预测研究

摘要第8-9页
ABSTRACT第9页
第一章 绪论第10-18页
    1.1 研究背景和意义第10-11页
    1.2 国内外研究现状第11-16页
        1.2.1 序列编码的研究第11-13页
        1.2.2 分类预测模型的研究第13-14页
        1.2.3 序列特征编码结合分类器预测效果第14-16页
    1.3 论文的主要工作第16页
    1.4 论文的结构安排第16-18页
第二章 数据集的构建第18-28页
    2.1 蛋白质亚细胞基础知识第18-20页
        2.1.1 亚细胞结构功能介绍第18-19页
        2.1.2 蛋白质组成第19-20页
    2.2 数据集选取第20-21页
        2.2.1 数据集的选取第21页
    2.3 数据集的构建第21-28页
        2.3.1 数据集的构建第21-22页
        2.3.2 基于UniProtKB的网络爬虫第22-23页
        2.3.3 利用cd-hit实现相似度的剔除第23-24页
        2.3.4 相似度的校验第24-28页
第三章 蛋白质特征提取算法第28-34页
    3.1 氨基酸组成特征(AAC)第28-29页
    3.2 二肽组成特征(Dipe)第29-30页
        3.2.1 基本二肽组成特征第29页
        3.2.2 基于物化属性的二肽降维特征第29-30页
    3.3 伪氨基酸组成特征(PseAAC)第30-32页
    3.4 位置权重氨基酸组分特征(PW_AAC)第32页
    3.5 基于氨基酸折射率的特征提取(RefIndex)第32-33页
    3.6 本章小结第33-34页
第四章 相似性比对改进KNN预测算法研究第34-56页
    4.1 KNN算法第34-39页
        4.1.1 KNN算法原理第34-35页
        4.1.2 KNN参数选择第35-36页
        4.1.3 检验方法与评价指标第36-38页
        4.1.4 结果与讨论第38-39页
    4.2 相似性比对KNN算法(BKNN)第39-46页
        4.2.1 BKNN算法原理第39-42页
        4.2.2 BKNN参数选择(k)第42页
        4.2.3 结果与讨论第42-46页
    4.3 基于Hadoop框架的BKNN优化第46-54页
        4.3.1 HDFS文件系统第47-49页
        4.3.2 MapReduce计算框架第49-50页
        4.3.3 Hadoop集群部署第50-52页
        4.3.4 加速比分析第52-54页
    4.4 本章小结第54-56页
第五章 集成分类器亚细胞区间预测算法研究第56-66页
    5.1 AdaBoost集成BKNN分类预测算法第56-60页
        5.1.1 AdaBoost分类算法原理第56-58页
        5.1.2 结果与讨论第58-60页
    5.2 Bagging集成BKNN分类预测算法第60-64页
        5.2.1 Bagging分类算法原理第60-61页
        5.2.2 结果与讨论第61-64页
    5.3 本章小结第64-66页
第六章 结论以及展望第66-68页
参考文献第68-76页
致谢第76-78页
攻读学位期间发表的学术论文第78页

论文共78页,点击 下载论文
上一篇:环境因素对螺旋藻的生长和生化成分影响的分析
下一篇:兔粘液瘤病毒和兔纤维瘤病毒荧光PCR鉴别诊断方法的建立