基于随机森林和ReliefF的致病SNP识别方法

摘要	第5-7页
ABSTRACT	第7-8页
符号对照表	第11-12页
缩略语对照表	第12-15页
第一章绪论	第15-21页
1.1 研究背景与意义	第15-17页
1.1.1 研究背景	第15-17页
1.1.2 研究意义	第17页
1.2 国内外研究现状	第17-18页
1.2.1 国外研究现状	第17-18页
1.2.2 国内研究现状	第18页
1.3 本文研究内容	第18-19页
1.4 本文结构安排	第19-21页
第二章 SNP致病作用识别方法介绍与性能比较	第21-39页
2.1 单位点关联性测试	第21-22页
2.2 随机森林方法识别致病SNP位点	第22-25页
2.2.1 决策树CART	第22页
2.2.2 分裂节点	第22-23页
2.2.3 构建随机森林	第23页
2.2.4 变量重要性值	第23-24页
2.2.5 随机森林识别致病SNP位点	第24-25页
2.3 ReliefF方法识别致病SNP位点	第25-27页
2.3.1 原始Relief方法	第25-26页
2.3.2 ReliefF和TuRF	第26页
2.3.3 假设间隔理论	第26-27页
2.4 SNP致病作用识别方法性能比较	第27-39页
2.4.1 单位点关联测试	第29-31页
2.4.2 随机森林方法	第31-35页
2.4.3 ReliefF方法	第35-36页
2.4.4 三种方法的识别率对比	第36-39页
第三章结合随机森林和ReliefF的识别方法	第39-51页
3.1 基尼重要性值与ReliefF权重的关联	第39-41页
3.2 TuRF	第41-42页
3.3 结合随机森林和ReliefF的后向缩减排序方法	第42-45页
3.3.1 方法步骤	第42-44页
3.3.2 方法分析	第44-45页
3.4 结合随机森林和ReliefF的弹性网方法	第45-49页
3.4.1 弹性网	第45-46页
3.4.2 方法思想	第46-48页
3.4.3 方法分析	第48-49页
3.5 本章小结	第49-51页
第四章实验研究与分析	第51-65页
4.1 实验数据集	第51-53页
4.1.1 模拟数据集	第51-53页
4.1.2 真实数据集AMD	第53页
4.2 本方法运行结果与分析	第53-63页
4.2.1 随机森林在模拟数据组上的识别结果	第53-55页
4.2.2 ReliefF在模拟数据组的识别结果	第55-56页
4.2.3 结合随机森林和ReliefF的后向缩减排序方法的识别结果	第56-60页
4.2.4 结合随机森林和ReliefF的弹性网方法的识别结果	第60-63页
4.3 本章小结	第63-65页
第五章结论和展望	第65-67页
5.1 研究结论	第65页
5.2 研究展望	第65-67页
参考文献	第67-71页
致谢	第71-73页
作者简介	第73-74页