致谢 | 第1-6页 |
中文摘要 | 第6-7页 |
Abstract | 第7-8页 |
序 | 第8-11页 |
1 引言 | 第11-19页 |
2 作业提交存在的问题定义 | 第19-30页 |
·作业提交阶段split流程概述 | 第19-20页 |
·Split过程中存在的问题 | 第20-26页 |
·getSplit方法存在的问题 | 第20-23页 |
·FileSystem中正则匹配存在的问题 | 第23-26页 |
·真实环境出现过的case举例 | 第26-29页 |
·内存OutOfMemory的case | 第26-27页 |
·输入路径正则表达式中间匹配到文件的case | 第27-29页 |
·解决这些问题的预期目标 | 第29-30页 |
3 Split过程优化方案 | 第30-45页 |
·解决blockLocations获取效率低的问题 | 第30-31页 |
·ls过程输入路径正则表达式中间匹配到文件优化 | 第31-34页 |
·getSplits占用内存过高的优化方案 | 第34-40页 |
·将getSplit过程移植到TaskTracker解决方案 | 第40-45页 |
4 测试报告 | 第45-59页 |
·测试环境 | 第45-47页 |
·Split移植TaskTracker后性能测试报告 | 第47-56页 |
·ls阶段匹配到中间文件的优化测试报告 | 第56-59页 |
5 结论 | 第59-61页 |
参考文献 | 第61-62页 |
作者简历 | 第62-64页 |
学位论文数据集 | 第64页 |