基于MapReduce的全基因组关联分析技术研究与实现

摘要	第5-7页
Abstract	第7-8页
第1章绪论	第12-18页
1.1 研究背景与意义	第12-16页
1.2 本文的组织结构	第16-18页
第2章相关工作	第18-30页
2.1 特征选择简介	第18-22页
2.1.1 特征选择定义	第18-19页
2.1.2 特征子集产生过程	第19-20页
2.1.3 特征子集评价函数	第20-22页
2.2 传统特征选择方法	第22-25页
2.2.1 Filter方法	第22-23页
2.2.2 Wrapper方法	第23-24页
2.2.3 Embedded方法	第24-25页
2.3 交互特征选择	第25-27页
2.3.1 两位点交互特征选择	第25-26页
2.3.2 多位点交互特征选择	第26-27页
2.4 Hadoop平台介绍	第27-29页
2.4.1 HDFS分布式文件系统	第27-28页
2.4.2 MapReduce分布式计算模型	第28-29页
2.5 本章小结	第29-30页
第3章基本概念和问题定义	第30-42页
3.1 基本概念	第30-39页
3.1.1 极大公共子序列	第30-32页
3.1.2 最小独立支配集	第32页
3.1.3 相关特征	第32-35页
3.1.4 交互特征	第35-39页
3.2 问题定义	第39-40页
3.3 本章小结	第40-42页
第4章基于MapReduce的全基因组关联分析算法	第42-58页
4.1 整体框架	第42-44页
4.2 关联区域划分	第44-45页
4.2.1 极大公共子序列	第44-45页
4.2.2 区域划分算法	第45页
4.3 关联区域选择	第45-47页
4.3.1 区域多样性	第45-46页
4.3.2 区域多样性选择算法	第46-47页
4.4 关联区域约简	第47-49页
4.4.1 一致性贡献率	第47-48页
4.4.2 关联区域约简算法	第48-49页
4.5 高阶非冗余交互发现	第49-56页
4.5.1 多位点互信息	第49-53页
4.5.2 削减策略	第53-54页
4.5.3 高阶非冗余交互发现算法	第54-56页
4.6 本章小结	第56-58页
第5章实验结果与性能分析	第58-66页
5.1 实验环境与数据集	第58-59页
5.2 算法效率分析	第59-62页
5.2.1 单机效率分析	第59-61页
5.2.2 集群效率分析	第61-62页
5.3 算法有效性分析	第62-64页
5.3.1 生物意义	第62-63页
5.3.2 分类准确率	第63-64页
5.4 本章小结	第64-66页
第6章工作总结与展望	第66-68页
6.1 工作总结	第66页
6.2 工作展望	第66-68页
参考文献	第68-74页
致谢	第74-76页
攻读硕士期间发表的论文及参与的项目	第76页