| 摘要 | 第1-8页 |
| Abstract | 第8-14页 |
| 第一章 绪论 | 第14-24页 |
| ·大数据处理技术简介 | 第14-18页 |
| ·大数据处理技术应用和研究背景 | 第14-15页 |
| ·MapReduce技术简介 | 第15-16页 |
| ·MapReduce并行程序设计模型和程序执行过程 | 第16-18页 |
| ·MAPREDUCE的主要研究问题和相关工作 | 第18-21页 |
| ·MapReduce的主要研究问题 | 第18-19页 |
| ·相关工作 | 第19-21页 |
| ·本文工作 | 第21-22页 |
| ·主要研究思路 | 第22页 |
| ·主要研究工作 | 第22页 |
| ·本文结构 | 第22-24页 |
| 第二章 基于MAPREDUCE并行化BLAST序列比对算法 | 第24-42页 |
| ·基因序列比对问题研究背景 | 第24-25页 |
| ·串行BLAST算法 | 第25-28页 |
| ·MAPREDUCE-BLAST方案一 | 第28-38页 |
| ·Map side extension blast算法 | 第28-30页 |
| ·序列数据库的存储与切分 | 第30-31页 |
| ·单词列表和扫描器的构造 | 第31-32页 |
| ·扫描单词匹配及扩展单词匹配 | 第32页 |
| ·扩展单词匹配中的优化 | 第32-33页 |
| ·Map side extension blast执行时间分析 | 第33页 |
| ·Map side extension blast实验评测 | 第33-38页 |
| ·MAPREDUCE-BLAST方案二 | 第38-41页 |
| ·Reduce side extension blast算法 | 第38-40页 |
| ·Reduce side extension blast实验测评 | 第40-41页 |
| ·MAPREDUCE-BLAST两种方案比较 | 第41页 |
| ·本章小结 | 第41-42页 |
| 第三章 MAPREDUCE并行计算框架的性能优化 | 第42-60页 |
| ·MAPREDUCE系统性能优化问题概述 | 第42-43页 |
| ·MAPREDUCE作业的时间开销分析 | 第43-44页 |
| ·MAPREDUCE执行框架分析 | 第44-52页 |
| ·MapReduce程序调度和执行基本过程 | 第44-46页 |
| ·作业和任务的状态转换 | 第46-49页 |
| ·运行时对象结构 | 第49-50页 |
| ·Task的时序流程分析 | 第50-52页 |
| ·MAPREDUCE并行计算框架的性能优化 | 第52-56页 |
| ·Job Setup/Cleanup的优化 | 第53-54页 |
| ·消息传递机制优化 | 第54-56页 |
| ·性能优化实验测评 | 第56-59页 |
| ·作业内部的任务调度效率测试 | 第56-58页 |
| ·应用算法案例性能测试 | 第58-59页 |
| ·本章小节 | 第59-60页 |
| 第四章 结束语 | 第60-62页 |
| ·本文工作总结 | 第60-61页 |
| ·进一步工作 | 第61-62页 |
| 参考文献 | 第62-66页 |
| 致谢 | 第66-68页 |
| 附录 研究生期间论文发表 | 第68-69页 |