首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于数据挖掘技术的致病位点分析

摘要第4-5页
Abstract第5页
第1章 引言第8-13页
    1.1 研究背景及意义第8-9页
    1.2 国内外的研究现状第9-10页
    1.3 研究目的和内容第10-11页
    1.4 论文组织结构第11-13页
第2章 基础理论介绍第13-18页
    2.1 生物信息学基本知识第13-14页
        2.1.1 生物信息学第13页
        2.1.2 单核苷酸多态性第13-14页
        2.1.3 全基因组关联研究第14页
    2.2 数据挖掘概述第14-15页
    2.3 随机森林模型第15-17页
        2.3.1 随机森林的分类性能评价第16页
        2.3.2 随机森林的泛化误差能力第16-17页
        2.3.3 随机森林的OOB估计第17页
    2.4 本章小结第17-18页
第3章 数据集处理及致病位点分析第18-35页
    3.1 数据集预处理第18-23页
        3.1.1 样本数据分析第18-19页
        3.1.2 数据编码第19-21页
        3.1.3 样本数据质量控制第21-23页
    3.2 基于列联表的卡方样本检验第23-29页
        3.2.1 列联表卡方检验方法概述第23-26页
        3.2.2 基于Bonferroni校正方法第26-27页
        3.2.3 实验结果分析第27-29页
    3.3 基于信息值的变量选择方法第29-33页
        3.3.1 证据权重转换第29-31页
        3.3.2 信息值计算第31-32页
        3.3.3 结果分析第32-33页
    3.4 本章小结第33-35页
第4章 基于两步模型的致病位点分析第35-50页
    4.1 基于基因遗传的显性模型第35-36页
    4.2 随机森林原理第36-41页
        4.2.1 随机森林模型的建立过程第36-40页
        4.2.2 变量重要性评价指标第40-41页
    4.3 随机森林的重要参数第41-43页
        4.3.1 参数Mtry第42页
        4.3.2 参数Ntree第42-43页
    4.4 基于显性模型和随机森林的致病位点分析第43-48页
        4.4.1 显性模型实现第43-45页
        4.4.2 随机森林模型的算法实现第45页
        4.4.3 实验结果与分析第45-48页
    4.5 本章小结第48-50页
第5章 基于随机森林的节点分类算法优化第50-57页
    5.1 决策树节点分裂算法分析第50-51页
    5.2 节点分裂算法的优化第51-56页
        5.2.1 节点分裂综合算法的提出第51-52页
        5.2.2 实验结果与分析第52-54页
        5.2.3 节点分裂综合算法性能比较第54-56页
    5.3 本章小结第56-57页
第6章 总结与展望第57-59页
参考文献第59-63页
致谢第63-64页
攻读硕士期间取得的研究成果第64页

论文共64页,点击 下载论文
上一篇:数据可视化技术在教务信息数据库中的应用
下一篇:高速视频建筑物健康监测数据处理方法研究