首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于hive的性能优化方法的研究与实践

摘要第1-5页
Abstract第5-6页
目录第6-9页
第一章 引言第9-13页
   ·背景第9-10页
   ·问题的提出第10-11页
   ·解决思路第11页
   ·主要工作第11-12页
   ·论文组织第12-13页
第二章 Hadoop实现原理与性能调优策略第13-25页
   ·Hadoop的特性与优势第13-14页
   ·HDFS系统第14-16页
     ·Hadoop文件系统第14页
     ·Hadoop体系结构第14-15页
     ·Hadoop计算方式第15-16页
     ·数据存取策略第16页
   ·Hadoop技术应用第16页
   ·Hadoop作业调优第16-25页
     ·Map side tuning参数第16-21页
     ·Reduce side tuning参数第21-25页
第三章 数据仓库基础框架——Hive第25-34页
   ·Hive的部分约定优化及SQL逻辑实现第25-28页
     ·Hive定义第25页
     ·Hive和数据库的异同第25-28页
     ·部分查询逻辑实现举例第28页
   ·全排序第28-31页
   ·笛卡尔积第31页
   ·exist in子句第31-32页
   ·Hive中reducer个数的分配情况第32页
   ·合并Map/Reduce操作第32-34页
第四章 Hive代码调优方案及分析第34-56页
   ·调优环境第34页
   ·代码优化方向第34-35页
   ·Hadoop计算框架的特点第35页
   ·内部自带优化方式第35-39页
     ·列裁剪(Column Pruning)第35-36页
     ·分区裁剪(Partition Pruning)第36页
     ·Join第36-37页
     ·Map Join第37-38页
     ·group by第38-39页
     ·合并小文件第39页
   ·外部代码调整常用优化方式典型案例分析第39-56页
     ·熟练地使用SQL提高查询效率第40-41页
     ·无效id在关联时的倾斜问题第41-42页
     ·不同数据类型关联产生的倾斜问题第42页
     ·利用Hive对union all优化的特性第42-43页
     ·解决Hive对union all优化的短板第43-45页
     ·利用group by替代count(distinct)达到优化效果第45-47页
     ·利用Hive中的union all特性减少Map/Reduce个数第47-48页
     ·对Hive优化模块(union all)的建议第48页
     ·数据倾斜的解决方法第48-49页
     ·map join的深度使用第49-50页
     ·使用组合KEY均分倾斜的记录第50-51页
     ·uv问题的求解第51-56页
第五章 总结和展望第56-58页
致谢第58-59页
参考文献第59-61页

论文共61页,点击 下载论文
上一篇:IT投资绩效评价指标体系研究--基于BSC框架的探索
下一篇:亿贝企业内部招聘系统的设计与在线应聘模块的实现