基于MapReduce的Web文本挖掘系统的研究与实现

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-14页
·研究背景及意义	第9-10页
·研究现状	第10-12页
·MapReduce研究现状	第10页
·NoSQL研究现状	第10-11页
·文本实体关系挖掘	第11-12页
·本文的主要工作	第12页
·论文的组织结构	第12-14页
第二章分布式数据处理关键技术的概述	第14-36页
·引言	第14页
·NOSQL数据库	第14-23页
·NoSQL技术简介与特征	第14-19页
·NoSQL数据库对比分析	第19-23页
·面向文档的MONGODB数据库	第23-30页
·MongoDB简介	第23-24页
·Auto-Sharding集群架构	第24-27页
·MongoDB数据建模技术	第27-30页
·MAPREDUCE技术	第30-34页
·MapReduce技术模型简介	第30-31页
·MapReduce工作原理	第31-34页
·MapReduce其它相关技术	第34页
·本章小结	第34-36页
第三章 WEB文本实体关系网络分析的应用研究与设计	第36-47页
·引言	第36页
·WEB内容挖掘应用技术研究	第36-42页
·中文分词	第37-39页
·主题词提取技术应用	第39-40页
·文本特征模型设计	第40-41页
·Web内容挖掘	第41-42页
·社会网络分析在WEB挖掘上的应用	第42-46页
·社会网络分析	第42-43页
·块模型(Block-Modeling)分析	第43-44页
·中心性分析	第44-46页
·本章小结	第46-47页
第四章基于分布式平台的WEB文本挖掘系统的设计	第47-72页
·引言	第47页
·应用流程的分析以及系统设计	第47-50页
·流程分析	第47-49页
·系统整体设计	第49页
·开发平台	第49-50页
·数据预处理层设计	第50-54页
·Web文本预处理流程	第50-51页
·文本格式解析	第51页
·分词并提取命名实体	第51-53页
·性能测试和分析	第53-54页
·数据存储设计	第54-63页
·RDBMS建模存在的问题	第54-55页
·MongoDB数据库设计	第55-56页
·MongoDB分片设计	第56-60页
·存储和查询方案	第60-62页
·数据库性能测试和对比	第62-63页
·数据功能层设计	第63-68页
·主要应用技术	第63页
·构建特征模型	第63-64页
·点度中心度分析的实现	第64-66页
·块模型分析的实现	第66-68页
·实验性能分析和对比	第68页
·展示层设计	第68-71页
·本章小结	第71-72页
第五章系统实验与分析	第72-78页
·引言	第72页
·实验准备	第72页
·硬件环境	第72页
·软件环境	第72页
·实验过程	第72-73页
·结果展示及分析	第73-76页
·本章小结	第76-78页
第六章总结与展望	第78-80页
·论文总结	第78页
·工作展望	第78-80页
参考文献	第80-82页
致谢	第82页