摘要 | 第5-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第11-19页 |
1.1 论文研究的目的和意义 | 第11-13页 |
1.2 国内外研究现状 | 第13-16页 |
1.2.1 国内外舆情监测研究现状 | 第13-14页 |
1.2.1.1 国外舆情的研究现状 | 第13页 |
1.2.1.2 国内舆情的研究现状 | 第13-14页 |
1.2.2 针对海量信息的数据挖掘研究及发展趋势 | 第14-16页 |
1.2.2.1 数据挖掘研究现状 | 第14-15页 |
1.2.2.2 数据挖掘的发展趋势 | 第15-16页 |
1.3 研究内容和研究目标 | 第16-17页 |
1.4 论文的章节安排 | 第17-19页 |
第2章 相关技术理论研究 | 第19-31页 |
2.1 信息提取技术 | 第19-23页 |
2.1.1 针对微博开放平台API爬取信息 | 第19-20页 |
2.1.2 网络爬虫技术 | 第20-23页 |
2.1.2.1 网页搜索策略 | 第21-23页 |
2.1.2.2 相关的开源爬虫框架 | 第23页 |
2.2 数据挖掘理论基础 | 第23-25页 |
2.2.1 数据挖掘概念 | 第23-24页 |
2.2.2 数据挖掘过程 | 第24-25页 |
2.2.3 数据挖掘方法 | 第25页 |
2.3 中文分词 | 第25-26页 |
2.4 数据仓库DW技术 | 第26-31页 |
2.4.1 DW主要特点 | 第26-28页 |
2.4.2 DW数据组织 | 第28-29页 |
2.4.2.1 DW数据组织结构 | 第28-29页 |
2.4.2.2 DW数据组织形式 | 第29页 |
2.4.3 DW体系结构 | 第29-31页 |
第3章 舆情监测与分析平台模型设计 | 第31-45页 |
3.1 舆情监测与分析需求分析 | 第31-35页 |
3.1.1 功能需求分析 | 第31-35页 |
3.1.2 非功能需求 | 第35页 |
3.2 舆情监测与分析平台总体设计 | 第35-37页 |
3.2.1 系统总体流程 | 第35页 |
3.2.2 系统体系结构 | 第35-37页 |
3.3 信息采集功能研究 | 第37-41页 |
3.4 基于K-means算法和词共现度的信息分析功能研究 | 第41-43页 |
3.4.1 K-means算法 | 第42页 |
3.4.2 词共现法 | 第42-43页 |
3.5 舆情展示功能研究 | 第43-45页 |
第4章 系统实现 | 第45-69页 |
4.1 信息采集功能实现 | 第45-53页 |
4.1.1 微博模拟登录 | 第45-51页 |
4.1.1.1 微博模拟登录分析过程 | 第45-49页 |
4.1.1.2 微博模拟登录实现 | 第49-51页 |
4.1.2 信息采集 | 第51-53页 |
4.2 信息分析功能实现 | 第53-63页 |
4.2.1 数据预处理 | 第53-58页 |
4.2.2 主题词抽取 | 第58-61页 |
4.2.2.1 词频统计与排序 | 第58-60页 |
4.2.2.2 计算权重 | 第60-61页 |
4.2.3 基于K-means和词共现法的主题词聚类 | 第61-63页 |
4.3 舆情展示实现 | 第63-69页 |
4.3.1 系统环境 | 第63-64页 |
4.3.2 舆情展示功能实现 | 第64-69页 |
4.3.2.1 系统界面 | 第64页 |
4.3.2.2 舆情分析实现 | 第64-65页 |
4.3.2.3 舆情趋势分析 | 第65-69页 |
第5章 系统测试 | 第69-73页 |
第6章 总结与展望 | 第73-75页 |
参考文献 | 第75-78页 |
致谢 | 第78页 |