热点事件挖掘系统的设计与实现
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第9-12页 |
1.1 研究背景 | 第9页 |
1.2 研究意义 | 第9-10页 |
1.3 本文工作 | 第10-11页 |
1.4 结构安排 | 第11-12页 |
第二章 相关技术研究 | 第12-23页 |
2.1 用户行为分析 | 第12-13页 |
2.2 Hadoop、Hive大数据处理 | 第13-18页 |
2.3 检索词相似度计算与聚类研究 | 第18-20页 |
2.4 Flask Web框架 | 第20-21页 |
2.5 ECharts数据可视化工具 | 第21-23页 |
第三章 系统需求分析 | 第23-28页 |
3.1 系统需求概述 | 第23-24页 |
3.2 环境需求 | 第24页 |
3.2.1 硬件资源 | 第24页 |
3.2.2 软件资源 | 第24页 |
3.3 功能需求 | 第24-27页 |
3.3.1 获取突发检索词 | 第25页 |
3.3.2 突发检索词聚类 | 第25-26页 |
3.3.3 高频检索词获取 | 第26页 |
3.3.4 总检索量获取 | 第26页 |
3.3.5 高频检索词召回 | 第26页 |
3.3.6 查看突发检索词 | 第26页 |
3.3.7 查看检索词检索量 | 第26-27页 |
3.3.8 查看热点事件 | 第27页 |
3.4 非功能需求 | 第27-28页 |
3.4.1 稳定性 | 第27页 |
3.4.2 可扩展性 | 第27-28页 |
第四章 系统概要设计 | 第28-33页 |
4.1 系统总体设计及模块划分 | 第28-31页 |
4.1.1 总体设计 | 第28-30页 |
4.1.2 模块详细说明 | 第30-31页 |
4.2 系统工作流程 | 第31-33页 |
第五章 系统详细设计与实现 | 第33-57页 |
5.1 突发检索词处理模块 | 第33-34页 |
5.2 突发检索词聚类模块 | 第34-39页 |
5.2.1 热点事件聚类原理分析 | 第34页 |
5.2.2 聚类算法设计 | 第34-37页 |
5.2.3 聚类算法改进 | 第37-39页 |
5.3 总检索量获取模块 | 第39-40页 |
5.4 高频检索词获取模块 | 第40-42页 |
5.4.1 提取高频检索词 | 第40-41页 |
5.4.2 高频检索词分词 | 第41-42页 |
5.5 热点事件检索词召回模块 | 第42-44页 |
5.6 工具类模块 | 第44-45页 |
5.7 数据可视化模块 | 第45-54页 |
5.7.1 模块搭建 | 第45-53页 |
5.7.2 加载数据图表 | 第53-54页 |
5.8 数据访问模块 | 第54-57页 |
第六章 系统测试 | 第57-65页 |
6.1 测试环境 | 第57页 |
6.2 测试工具 | 第57-58页 |
6.3 功能测试 | 第58-62页 |
6.4 性能测试 | 第62-64页 |
6.5 测试总结 | 第64-65页 |
第七章 总结与展望 | 第65-67页 |
7.1 总结 | 第65-66页 |
7.2 展望 | 第66-67页 |
参考文献 | 第67-69页 |
致谢 | 第69页 |