基于Hadoop的上市公司舆情挖掘系统的研究与实现

摘要	第1-6页
ABSTRACT	第6-9页
第一章绪论	第9-14页
·研究背景与意义	第9-11页
·研究课题背景	第9-11页
·研究意义	第11页
·国内外研究现状	第11-12页
·论文的研究工作	第12-13页
·论文结构安排	第13-14页
第二章相关技术理论介绍	第14-28页
·Hadoop 平台介绍	第14-19页
·Hadoop 分布式文件系统介绍	第15-16页
·MapReduce 编程模型介绍	第16-19页
·数据挖掘介绍	第19-24页
·网络挖掘	第19-20页
·监督式学习	第20-22页
·无监督学习	第22-24页
·Nutch 网络爬虫介绍	第24-28页
第三章上市公司舆情挖掘系统需求分析	第28-34页
·上市公司舆情挖掘系统概述	第28-29页
·上市公司舆情挖掘系统功能需求分析	第29-33页
·系统管理模块	第29-30页
·数据采集模块	第30-31页
·数据挖掘模块	第31页
·数据存储模块	第31-32页
·信息展示模块	第32-33页
·上市公司舆情挖掘系统性能需求分析	第33页
·本章小结	第33-34页
第四章舆情挖掘系统设计	第34-51页
·系统总体设计	第34-37页
·系统设计原则	第34-35页
·系统设计方案	第35-37页
·系统模块设计	第37-50页
·Web 数据采集模块	第38-39页
·聚类分析模块	第39-45页
·分类预测模块	第45-47页
·数据存储模块	第47-50页
·本章小结	第50-51页
第五章舆情挖掘的实现与测试	第51-75页
·系统平台搭建	第51-55页
·Hadoop 平台部署	第51-54页
·Nutch 爬虫部署	第54-55页
·数据采集模块的实现	第55-56页
·舆情挖掘模块的实现	第56-64页
·Canopy 聚类算法实现	第58-62页
·K-Means 聚类算法实现	第62-63页
·数据挖掘的实现包图	第63-64页
·聚类算法测试	第64-67页
·完整实例	第67-69页
·系统测试	第69-74页
·测试环境与用例	第69-70页
·功能测试	第70-73页
·性能测试	第73-74页
·本章小结	第74-75页
第六章总结与展望	第75-76页
致谢	第76-77页
参考文献	第77-81页
攻硕期间取得的研究成果	第81-82页