基于社会网络的WEB舆情系统的研究与实现
摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
第一章 引言 | 第10-15页 |
·课题背景 | 第10-11页 |
·研究目的和意义 | 第11-12页 |
·国内外研究现状 | 第12-13页 |
·论文研究内容及章节安排 | 第13-15页 |
第二章 WEB 信息的收集 | 第15-31页 |
·爬虫技术 | 第15-18页 |
·通用爬虫 | 第15-16页 |
·主题爬虫 | 第16-17页 |
·分布式爬虫 | 第17-18页 |
·分布式舆情爬虫子系统 | 第18-29页 |
·整体设计 | 第18-20页 |
·服务器和客户端工作原理 | 第20-24页 |
·配置器工作原理 | 第24-26页 |
·提取器工作原理 | 第26-27页 |
·动态页面的提取 | 第27-29页 |
·分布式舆情爬虫子系统性能测试 | 第29-31页 |
第三章 WEB 信息的主题类识别 | 第31-51页 |
·典型层次聚类算法分析 | 第32-35页 |
·经典凝聚算法 | 第32-33页 |
·单连接,全连接,平均连接聚类算法 | 第33-35页 |
·距离与相似度 | 第35-38页 |
·点间距离 | 第35-37页 |
·簇间距离 | 第37-38页 |
·主题类识别算法 | 第38-44页 |
·主题定义 | 第38-39页 |
·初分类 | 第39-41页 |
·主题聚类算法 | 第41-43页 |
·主题聚类算法性能测试 | 第43-44页 |
·基于HADOOP 平台的主题聚类 | 第44-51页 |
·Hadoop 框架与流程 | 第44-47页 |
·主题识别聚类算法的改写 | 第47-49页 |
·基于Hadoop 平台主题聚类算法性能测试 | 第49-51页 |
第四章 基于社会网络的舆情发现 | 第51-62页 |
·社会网络抽取 | 第51-52页 |
·社会网络相关概念与定义 | 第52-53页 |
·基于社会网络的舆情发现 | 第53-62页 |
·主题用户子网络的建立 | 第56页 |
·主题传播子网络的建立 | 第56-57页 |
·舆情发现子网络的建立 | 第57页 |
·基于社会网络的舆情挖掘 | 第57-62页 |
第五章 WEB 舆情发现系统设计与实现 | 第62-75页 |
·系统总体设计和实现框架 | 第62-64页 |
·WEB 信息的收集 | 第64-67页 |
·服务器组件 | 第64-66页 |
·客户机组件 | 第66-67页 |
·WEB 信息的主题类识别 | 第67-70页 |
·主题提取组件 | 第67-69页 |
·主题分类组件 | 第69页 |
·主题聚类组件 | 第69-70页 |
·社会网络舆情发现 | 第70-71页 |
·网络构建组件 | 第70-71页 |
·舆情分析组件 | 第71页 |
·系统实验数据展示 | 第71-75页 |
第六章 总结和展望 | 第75-76页 |
致谢 | 第76-77页 |
参考文献 | 第77-80页 |
攻硕期间取得的研究成果 | 第80-81页 |