基于Storm实时日志分析存储系统的设计与实现

中文摘要	第4-5页
Abstract	第5页
第1章绪论	第8-11页
1.1 项目的背景与意义	第8-9页
1.2 国内外研究的现状	第9页
1.3 本文研究的重要工作	第9-10页
1.4 论文的组织结构	第10-11页
第2章相关技术介绍	第11-17页
2.1 Hadoop	第11-12页
2.1.1 HDFS	第11-12页
2.1.2 MapReduce	第12页
2.2 HDFS主要流程	第12-13页
2.3 Storm	第13-15页
2.3.1 Storm的几个组件	第13-14页
2.3.2 Storm的数据流分组	第14页
2.3.3 Storm的数据保障机制	第14-15页
2.4 HBase	第15页
2.5 Flume	第15页
2.6 Zookeeper	第15页
2.7 Kafka	第15-16页
2.8 本章小结	第16-17页
第3章系统的设计	第17-24页
3.1 Web log结构定义	第17页
3.2 系统功能	第17-18页
3.3 系统总体架构和模块设计	第18-23页
3.3.1 总体架构	第18-19页
3.3.2 模块设计	第19-23页
3.4 系统关键任务流程	第23页
3.5 本章小结	第23-24页
第4章系统功能实现	第24-33页
4.1 日志收集	第24-25页
4.2 Kafka topic创建	第25页
4.3 Storm Topology创建	第25-26页
4.4 Spout节点的实现	第26页
4.5 日志抽取分流节点	第26-28页
4.6 请求URL分析的Bolt节点	第28页
4.7 外链URL和搜索关键词的Bolt节点	第28-29页
4.8 KPI计数Bolt节点	第29-30页
4.9 IP计数Bolt节点	第30-31页
4.10 数据持久化Bolt节点	第31页
4.11 本章小结	第31-33页
第5章系统搭建与测试	第33-47页
5.1 组件规划与搭建	第33-39页
5.1.1 主机的相关配置、软件安装	第33-34页
5.1.2 SSH免密码登录	第34-35页
5.1.3 配置Hadoop	第35-38页
5.1.4 HBase组件搭建	第38-39页
5.1.5 Storm组件搭建	第39页
5.2 系统测试	第39-46页
5.2.1 启动服务进程	第39-40页
5.2.2 生成测试数据	第40页
5.2.3 Flume agent日志收集	第40-41页
5.2.4 Kafka消息队列	第41页
5.2.5 数据实时计算和结果存储	第41-46页
5.3 本章小结	第46-47页
第6章总结与展望	第47-48页
参考文献	第48-50页
致谢	第50页