| 致谢 | 第1-6页 |
| 中文摘要 | 第6-7页 |
| Abstract | 第7-8页 |
| 序 | 第8-11页 |
| 1 引言 | 第11-19页 |
| 2 作业提交存在的问题定义 | 第19-30页 |
| ·作业提交阶段split流程概述 | 第19-20页 |
| ·Split过程中存在的问题 | 第20-26页 |
| ·getSplit方法存在的问题 | 第20-23页 |
| ·FileSystem中正则匹配存在的问题 | 第23-26页 |
| ·真实环境出现过的case举例 | 第26-29页 |
| ·内存OutOfMemory的case | 第26-27页 |
| ·输入路径正则表达式中间匹配到文件的case | 第27-29页 |
| ·解决这些问题的预期目标 | 第29-30页 |
| 3 Split过程优化方案 | 第30-45页 |
| ·解决blockLocations获取效率低的问题 | 第30-31页 |
| ·ls过程输入路径正则表达式中间匹配到文件优化 | 第31-34页 |
| ·getSplits占用内存过高的优化方案 | 第34-40页 |
| ·将getSplit过程移植到TaskTracker解决方案 | 第40-45页 |
| 4 测试报告 | 第45-59页 |
| ·测试环境 | 第45-47页 |
| ·Split移植TaskTracker后性能测试报告 | 第47-56页 |
| ·ls阶段匹配到中间文件的优化测试报告 | 第56-59页 |
| 5 结论 | 第59-61页 |
| 参考文献 | 第61-62页 |
| 作者简历 | 第62-64页 |
| 学位论文数据集 | 第64页 |