面向物流海量数据管理及应用研究

摘要	第4-5页
Abstract	第5-6页
第一章绪论	第9-12页
1.1 课题背景	第9-11页
1.2 文章主要内容及章节安排	第11-12页
第二章相关技术的介绍	第12-30页
2.1 云计算的概念	第12-14页
2.1.1 云计算的分类	第12-13页
2.1.2 云计算特点	第13-14页
2.2 Hadoop 简介	第14-18页
2.2.1 Hadoop 历史	第14-15页
2.2.2 Hadoop 优势	第15页
2.2.3 Hadoop 子项目	第15-16页
2.2.4 Hadoop 框架模型	第16-18页
2.2.5 Hadoop 应用举例	第18页
2.3 Hadoop 关键技术	第18-29页
2.3.1 Hadoop 分布式文件系统(HDFS)	第18-23页
2.3.2 MapReduce 技术	第23-27页
2.3.3 Mahout 技术	第27-29页
2.4 本章小结	第29-30页
第三章海量物流数据存储的设计和实现	第30-46页
3.1 现有 HDFS 架构不足	第30-31页
3.2 MongoDB 技术简介	第31-34页
3.2.1 MongoDB 集群的架构分析	第32-33页
3.2.2 MongoDB 集群的分片机制	第33-34页
3.3 可扩展的多 NameNode 节点优化原理	第34-37页
3.3.1 优化难点	第34页
3.3.2 基于 MongoDB 的解决方案	第34-37页
3.4 多 NameNode 节点的优化应以 MongoDB 为基础来实现	第37-43页
3.5 实验结果及相关分析	第43-45页
3.6 本章小结	第45-46页
第四章物流海量数据挖掘子系统	第46-58页
4.1 云数据挖掘子系统简介	第46-47页
4.2 数据挖掘概述	第47页
4.3 文本聚类	第47-50页
4.3.1 中文分词	第49-50页
4.3.2 文本表示模型	第50页
4.4 物流海量数据 K-Means 算法并行分析	第50-55页
4.4.1 并行策略	第50-51页
4.4.2 Mahout K-Means 结构	第51-52页
4.4.3 K-Means 聚类 MapReduce 实现	第52-55页
4.5 并行挖掘与串行挖掘比较	第55-57页
4.6 K-Means 算法应用到物流行业	第57页
4.7 本章小结	第57-58页
第五章平台搭建及实验	第58-68页
5.1 Hadoop 平台的搭建	第58-61页
5.1.1 搭建 Hadoop 集群	第58页
5.1.2 搭建 hadoop	第58-61页
5.2 安装 MongoDB 数据库	第61-62页
5.3 安装 Mahout	第62-65页
5.3.1 安装 Maven	第62-64页
5.3.2 Mahout 的下载及安装	第64-65页
5.4 实验过程	第65-67页
5.4.1 实验一	第65-66页
5.4.2 实验二	第66-67页
5.5 本章小结	第67-68页
第六章展望与总结	第68-70页
6.1 总结	第68页
6.2 展望	第68-70页
参考文献	第70-73页
附录 2 攻读硕士学位期间撰写的论文	第73-74页
附录 3 攻读硕士学位期间申请的专利	第74-75页
附录 4 攻读硕士学位期间参加的科研项目	第75-76页
致谢	第76页