首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

HADOOP作业启动性能优化实践

致谢第1-6页
中文摘要第6-7页
Abstract第7-8页
第8-11页
1 引言第11-19页
2 作业提交存在的问题定义第19-30页
   ·作业提交阶段split流程概述第19-20页
   ·Split过程中存在的问题第20-26页
     ·getSplit方法存在的问题第20-23页
     ·FileSystem中正则匹配存在的问题第23-26页
   ·真实环境出现过的case举例第26-29页
     ·内存OutOfMemory的case第26-27页
     ·输入路径正则表达式中间匹配到文件的case第27-29页
   ·解决这些问题的预期目标第29-30页
3 Split过程优化方案第30-45页
   ·解决blockLocations获取效率低的问题第30-31页
   ·ls过程输入路径正则表达式中间匹配到文件优化第31-34页
   ·getSplits占用内存过高的优化方案第34-40页
   ·将getSplit过程移植到TaskTracker解决方案第40-45页
4 测试报告第45-59页
   ·测试环境第45-47页
   ·Split移植TaskTracker后性能测试报告第47-56页
   ·ls阶段匹配到中间文件的优化测试报告第56-59页
5 结论第59-61页
参考文献第61-62页
作者简历第62-64页
学位论文数据集第64页

论文共64页,点击 下载论文
上一篇:基于PCI Express接口的高速数据传输系统设计
下一篇:基于信任度的数字权限管理研究