首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于MapReduce的Web文本挖掘系统的研究与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-14页
   ·研究背景及意义第9-10页
   ·研究现状第10-12页
     ·MapReduce研究现状第10页
     ·NoSQL研究现状第10-11页
     ·文本实体关系挖掘第11-12页
   ·本文的主要工作第12页
   ·论文的组织结构第12-14页
第二章 分布式数据处理关键技术的概述第14-36页
   ·引言第14页
   ·NOSQL数据库第14-23页
     ·NoSQL技术简介与特征第14-19页
     ·NoSQL数据库对比分析第19-23页
   ·面向文档的MONGODB数据库第23-30页
     ·MongoDB简介第23-24页
     ·Auto-Sharding集群架构第24-27页
     ·MongoDB数据建模技术第27-30页
   ·MAPREDUCE技术第30-34页
     ·MapReduce技术模型简介第30-31页
     ·MapReduce工作原理第31-34页
     ·MapReduce其它相关技术第34页
   ·本章小结第34-36页
第三章 WEB文本实体关系网络分析的应用研究与设计第36-47页
   ·引言第36页
   ·WEB内容挖掘应用技术研究第36-42页
     ·中文分词第37-39页
     ·主题词提取技术应用第39-40页
     ·文本特征模型设计第40-41页
     ·Web内容挖掘第41-42页
   ·社会网络分析在WEB挖掘上的应用第42-46页
     ·社会网络分析第42-43页
     ·块模型(Block-Modeling)分析第43-44页
     ·中心性分析第44-46页
   ·本章小结第46-47页
第四章 基于分布式平台的WEB文本挖掘系统的设计第47-72页
   ·引言第47页
   ·应用流程的分析以及系统设计第47-50页
     ·流程分析第47-49页
     ·系统整体设计第49页
     ·开发平台第49-50页
   ·数据预处理层设计第50-54页
     ·Web文本预处理流程第50-51页
     ·文本格式解析第51页
     ·分词并提取命名实体第51-53页
     ·性能测试和分析第53-54页
   ·数据存储设计第54-63页
     ·RDBMS建模存在的问题第54-55页
     ·MongoDB数据库设计第55-56页
     ·MongoDB分片设计第56-60页
     ·存储和查询方案第60-62页
     ·数据库性能测试和对比第62-63页
   ·数据功能层设计第63-68页
     ·主要应用技术第63页
     ·构建特征模型第63-64页
     ·点度中心度分析的实现第64-66页
     ·块模型分析的实现第66-68页
     ·实验性能分析和对比第68页
   ·展示层设计第68-71页
   ·本章小结第71-72页
第五章 系统实验与分析第72-78页
   ·引言第72页
   ·实验准备第72页
     ·硬件环境第72页
     ·软件环境第72页
   ·实验过程第72-73页
   ·结果展示及分析第73-76页
   ·本章小结第76-78页
第六章 总结与展望第78-80页
   ·论文总结第78页
   ·工作展望第78-80页
参考文献第80-82页
致谢第82页

论文共82页,点击 下载论文
上一篇:基于近邻保护嵌入的数据降维算法研究
下一篇:Android手机上图像分类技术的研究