基于MapReduce的社区发现算法的设计与实现

摘要	第5-6页
Abstract	第6-7页
1 绪论	第10-16页
1.1 研究意义与应用前景	第10-11页
1.2 国内外研究现状分析	第11-13页
1.3 研究内容	第13-14页
1.4 论文组织结构	第14-16页
2 相关理论知识及软件	第16-26页
2.1 社区发现的含义	第16-18页
2.2 Hadoop平台以及MapReduce简介	第18-24页
2.2.1 Hadoop简介	第18页
2.2.2 HDFS简介	第18-20页
2.2.3 MapReduce简介	第20-24页
2.3 PEGASUS	第24页
2.4 分词工具ICTCLAS	第24-25页
2.5 小结	第25-26页
3 基于内容的MapReduce社区发现算法设计	第26-45页
3.1 用于社区发现的聚类相关概念	第26-30页
3.1.1 常用的相似度计算方法	第26-27页
3.1.2 相似邻居的选择	第27-28页
3.1.3 聚类关键问题	第28页
3.1.4 文本挖掘关键问题	第28-30页
3.1.5 相关计算公式定义	第30页
3.2 常用聚类算法	第30-33页
3.2.1 KMeans聚类算法	第30-31页
3.2.2 模糊KMeans聚类算法	第31-32页
3.2.3 Canopy聚类算法	第32-33页
3.3 基于MapReduce的MRKC聚类算法的设计与实现	第33-37页
3.4 基于MapReduce的文本预处理算法设计与实现	第37-44页
3.5 小结	第44-45页
4 基于结构的MapReduce社区发现算法设计与实现	第45-53页
4.1 总体算法流程	第45-46页
4.2 预处理阶段	第46-49页
4.3 核心处理阶段	第49-51页
4.4 最终处理阶段	第51-52页
4.5 小结	第52-53页
5 原型系统实现及实验分析	第53-69页
5.1 原型系统设计	第53-54页
5.2 原型系统实现	第54-60页
5.2.1 软硬件环境	第54-56页
5.2.2 爬虫模块	第56-58页
5.2.2.1 爬虫模块流程	第56-57页
5.2.2.2 爬虫数据预处理	第57-58页
5.2.3 社区发现原型系统操作界面	第58页
5.2.4 社区发现结果可视化	第58-60页
5.3 基于内容的MapReduce社区发现算法实验	第60-64页
5.4 基于结构的MapReduce社区发现算法实验	第64-67页
5.5 小结	第67-69页
6 结论	第69-71页
6.1 本文总结	第69-70页
6.2 未来的工作	第70-71页
致谢	第71-72页
参考文献	第72-76页
附录	第76页