基于MapReduce的基因数据分析算法研究

摘要	第4-5页
Abstract	第5-6页
目录	第7-10页
第1章绪论	第10-15页
1.1 研究背景	第10页
1.2 国内外现状	第10-12页
1.3 主要工作	第12-13页
1.4 内容安排	第13-15页
第2章预备知识	第15-26页
2.1 MapReduce并行框架简介	第15-16页
2.2 基因数据分析简介	第16-18页
2.2.1 基因数据分析的处理流程	第16页
2.2.2 读段定位数据简介	第16-18页
2.2.3 基因聚类数据简介	第18页
2.3 基因读段定位简介	第18-22页
2.3.1 不跨越剪切位的读段定位方法	第19-20页
2.3.2 跨越剪切位的读段定位方法	第20-21页
2.3.3 其他读段定位方法	第21-22页
2.4 基因数据聚类方法简介	第22-24页
2.4.1 基于划分的聚类方法	第22-23页
2.4.2 基于密度的聚类方法	第23页
2.4.3 基于层次的聚类方法	第23-24页
2.5 其他聚类方法	第24页
2.6 本章小结	第24-26页
第3章基于MapReduce的基因读段定位算法研究	第26-35页
3.1 引言	第26页
3.2 SeqMap软件中的空位种子算法	第26-27页
3.3 基于MapReduce的空位种子索引算法	第27-30页
3.3.1 不跨越剪切位的空位种子并行算法(PSeqMap)	第27-28页
3.3.2 跨越剪切位的空位种子并行算法(PJuncSeqMap)	第28-30页
3.4 PJuncSeqMap算法中负载平衡的解决方案	第30-31页
3.5 实验	第31-34页
3.5.1 实验数据	第31页
3.5.2 实验设置	第31页
3.5.3 实验结果与分析	第31-34页
3.6 本章小结	第34-35页
第4章基于MapReduce的基因读段定位改进算法研究	第35-41页
4.1 引言	第35页
4.2 PJuncSeqMap的改进算法	第35-39页
4.2.1 Hadoop分布式缓存的应用	第35页
4.2.2 融入生物信息缩小搜索空间	第35-36页
4.2.3 跨越剪切位定位算法的改进思路	第36-38页
4.2.4 PJuncSeqMap的改进算法描述	第38-39页
4.3 实验	第39-40页
4.3.1 实验数据和实验设置	第39页
4.3.2 实验结果与分析算法思想	第39-40页
4.4 本章小结	第40-41页
第5章基于MapReduce的密度层次聚类算法研究	第41-51页
5.1 引言	第41页
5.2 DHC算法简介	第41-43页
5.3 基于MapReduce的密度层次聚类算法	第43-45页
5.3.1 基于数据稀疏化的并行密度层次聚类算法	第43-44页
5.3.2 基于MapReduce的密度层次聚类算法DisDHC	第44-45页
5.4 实验	第45-50页
5.4.1 实验数据	第45-46页
5.4.2 实验设置	第46页
5.4.3 实验结果与分析	第46-50页
5.5 本章小结	第50-51页
第6章结束语	第51-53页
6.1 工作总结	第51-52页
6.2 工作展望	第52-53页
参考文献	第53-59页
附录	第59-60页
致谢	第60页