摘要 | 第4-5页 |
Abstract | 第5-6页 |
第一章 绪论 | 第11-20页 |
1.1 选题背景和意义 | 第11-12页 |
1.2 研究现状和存在问题 | 第12-17页 |
1.3 主要研究和开发工作 | 第17-18页 |
1.3.1 网站日志解析系统的设计和开发 | 第17页 |
1.3.2 大数据处理平台的架构和实现 | 第17-18页 |
1.4 论文的组织和结构安排 | 第18-20页 |
第二章 基于Hadoop架构的网站日志解析系统关键技术分析 | 第20-28页 |
2.1 Hadoop相关项目 | 第20-24页 |
2.1.1 HDFS | 第20-21页 |
2.1.2 MapReduce | 第21-23页 |
2.1.3 HBase | 第23页 |
2.1.4 HBase和MapReduce集成 | 第23-24页 |
2.2 JavaEE | 第24-25页 |
2.3 MySQL | 第25-26页 |
2.4 数据可视化技术 | 第26-27页 |
2.5 本章总结 | 第27-28页 |
第三章 基于Hadoop架构的网站日志解析系统的设计 | 第28-66页 |
3.1 网站日志 | 第28-31页 |
3.1.1 Tomcat日志 | 第28-29页 |
3.1.2 日志信息 | 第29-30页 |
3.1.3 SEO和网站安全 | 第30-31页 |
3.2 需求分析 | 第31-38页 |
3.2.1 业务流程分析 | 第32-33页 |
3.2.2 功能需求分析 | 第33-36页 |
3.2.3 系统架构说明 | 第36-37页 |
3.2.4 系统安全分析 | 第37-38页 |
3.3 原型设计 | 第38-42页 |
3.3.1 静态原型设计 | 第38-41页 |
3.3.2 数据可视化设计 | 第41-42页 |
3.4 详细设计 | 第42-65页 |
3.4.1 数据字典设计 | 第42-43页 |
3.4.2 用例设计 | 第43-48页 |
3.4.3 日志文件预处理设计 | 第48-51页 |
3.4.4 HBase数据库设计 | 第51-57页 |
3.4.5 日志解析批处理算法设计 | 第57-62页 |
3.4.6 数据可视化查询分析算法设计 | 第62-63页 |
3.4.7 系统模型设计 | 第63-65页 |
3.5 本章总结 | 第65-66页 |
第四章 基于Hadoop架构的网站日志解析系统的实现 | 第66-94页 |
4.1 分布式集群架设 | 第66-70页 |
4.1.1 VMware和CentOS | 第66-67页 |
4.1.2 Hadoop集群架设 | 第67-69页 |
4.1.3 HBase集群架设 | 第69-70页 |
4.2 分布式开发环境说明 | 第70-71页 |
4.3 批处理计算的实现 | 第71-79页 |
4.3.1 HDFS的实现 | 第71-73页 |
4.3.2 MapReduce的实现 | 第73-79页 |
4.4 查询分析计算的实现 | 第79-88页 |
4.4.1 HBase的实现 | 第80-85页 |
4.4.2 MapReduce和HBase集成的实现 | 第85-88页 |
4.5 网站日志解析系统的部署运行 | 第88-93页 |
4.5.1 Tomcat服务器安装和配置 | 第88-89页 |
4.5.2 网站日志解析系统部署和运行 | 第89-93页 |
4.6 本章总结 | 第93-94页 |
第五章 总结和展望 | 第94-96页 |
5.1 总结 | 第94-95页 |
5.2 展望 | 第95-96页 |
致谢 | 第96-97页 |
参考文献 | 第97-98页 |
附录 | 第98-103页 |
A 数据存储单位换算关系 | 第98页 |
B Hadoop配置信息 | 第98-102页 |
C HBase配置信息 | 第102-103页 |