基于社会网络的WEB舆情系统的研究与实现
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-10页 |
| 第一章 引言 | 第10-15页 |
| ·课题背景 | 第10-11页 |
| ·研究目的和意义 | 第11-12页 |
| ·国内外研究现状 | 第12-13页 |
| ·论文研究内容及章节安排 | 第13-15页 |
| 第二章 WEB 信息的收集 | 第15-31页 |
| ·爬虫技术 | 第15-18页 |
| ·通用爬虫 | 第15-16页 |
| ·主题爬虫 | 第16-17页 |
| ·分布式爬虫 | 第17-18页 |
| ·分布式舆情爬虫子系统 | 第18-29页 |
| ·整体设计 | 第18-20页 |
| ·服务器和客户端工作原理 | 第20-24页 |
| ·配置器工作原理 | 第24-26页 |
| ·提取器工作原理 | 第26-27页 |
| ·动态页面的提取 | 第27-29页 |
| ·分布式舆情爬虫子系统性能测试 | 第29-31页 |
| 第三章 WEB 信息的主题类识别 | 第31-51页 |
| ·典型层次聚类算法分析 | 第32-35页 |
| ·经典凝聚算法 | 第32-33页 |
| ·单连接,全连接,平均连接聚类算法 | 第33-35页 |
| ·距离与相似度 | 第35-38页 |
| ·点间距离 | 第35-37页 |
| ·簇间距离 | 第37-38页 |
| ·主题类识别算法 | 第38-44页 |
| ·主题定义 | 第38-39页 |
| ·初分类 | 第39-41页 |
| ·主题聚类算法 | 第41-43页 |
| ·主题聚类算法性能测试 | 第43-44页 |
| ·基于HADOOP 平台的主题聚类 | 第44-51页 |
| ·Hadoop 框架与流程 | 第44-47页 |
| ·主题识别聚类算法的改写 | 第47-49页 |
| ·基于Hadoop 平台主题聚类算法性能测试 | 第49-51页 |
| 第四章 基于社会网络的舆情发现 | 第51-62页 |
| ·社会网络抽取 | 第51-52页 |
| ·社会网络相关概念与定义 | 第52-53页 |
| ·基于社会网络的舆情发现 | 第53-62页 |
| ·主题用户子网络的建立 | 第56页 |
| ·主题传播子网络的建立 | 第56-57页 |
| ·舆情发现子网络的建立 | 第57页 |
| ·基于社会网络的舆情挖掘 | 第57-62页 |
| 第五章 WEB 舆情发现系统设计与实现 | 第62-75页 |
| ·系统总体设计和实现框架 | 第62-64页 |
| ·WEB 信息的收集 | 第64-67页 |
| ·服务器组件 | 第64-66页 |
| ·客户机组件 | 第66-67页 |
| ·WEB 信息的主题类识别 | 第67-70页 |
| ·主题提取组件 | 第67-69页 |
| ·主题分类组件 | 第69页 |
| ·主题聚类组件 | 第69-70页 |
| ·社会网络舆情发现 | 第70-71页 |
| ·网络构建组件 | 第70-71页 |
| ·舆情分析组件 | 第71页 |
| ·系统实验数据展示 | 第71-75页 |
| 第六章 总结和展望 | 第75-76页 |
| 致谢 | 第76-77页 |
| 参考文献 | 第77-80页 |
| 攻硕期间取得的研究成果 | 第80-81页 |