摘要 | 第8-9页 |
ABSTRACT | 第9页 |
第一章 绪论 | 第11-21页 |
1.1 研究背景和问题 | 第11-12页 |
1.2 国内外研究现状和发展趋势 | 第12-16页 |
1.2.1 国内外研究现状 | 第12-15页 |
1.2.2 发展趋势 | 第15-16页 |
1.3 本文主要研究工作 | 第16-18页 |
1.4 本文的组织结构 | 第18-21页 |
第二章 热点话题发现及演化相关工作 | 第21-37页 |
2.1 话题发现及演化的基本概念 | 第21-22页 |
2.1.1 话题发现的基本概念 | 第21-22页 |
2.1.2 话题演化的基本概念 | 第22页 |
2.2 话题发现的流程和主要方法 | 第22-33页 |
2.2.1 热点话题发现的流程 | 第22-26页 |
2.2.2 文本聚类算法 | 第26-33页 |
2.3 话题演化的方法和流程 | 第33-35页 |
2.3.1 话题演化流程 | 第33-34页 |
2.3.2 话题演化相关方法 | 第34-35页 |
2.4 MapReduce框架和计算模式 | 第35-36页 |
2.4.1 分布式编程框架简介 | 第35页 |
2.4.2 MapReduce框架的基本原理 | 第35-36页 |
2.5 本章小结 | 第36-37页 |
第三章 基于MapReduce的Single-Pass热点话题发现方法研究 | 第37-49页 |
3.1 基于Mapreduce的Single-Pass聚类算法 | 第37-43页 |
3.1.1 算法描述 | 第37-39页 |
3.1.2 算法的可行性证明 | 第39-40页 |
3.1.3 实验配置及结果分析 | 第40-43页 |
3.2 基于MapReduce的层次化Single-Pass聚类算法 | 第43-47页 |
3.2.1 算法描述 | 第43-45页 |
3.2.2 实验配置及结果分析 | 第45-47页 |
3.3 本章小结 | 第47-49页 |
第四章 热点话题演化关键方法研究 | 第49-60页 |
4.1 话题热度评价指标体系的依据及其重要性 | 第49-51页 |
4.2 热点话题演化框架及指标体系建立 | 第51-54页 |
4.2.1 话题演化框架 | 第51-52页 |
4.2.2 话题演化指标体系 | 第52-54页 |
4.3 话题演化曲线构建 | 第54-59页 |
4.3.1 参数设定 | 第54-55页 |
4.3.2 实验配置及结果分析 | 第55-59页 |
4.4 本章小结 | 第59-60页 |
第五章 热点话题发现及演化原型系统分析 | 第60-70页 |
5.1 试验环境介绍 | 第60-62页 |
5.1.1 软硬件配置 | 第60页 |
5.1.2 处理流程 | 第60-62页 |
5.2 热点话题发现案例分析 | 第62-66页 |
5.2.1 话题发现性能分析 | 第62-63页 |
5.2.2 根据实例分析话题发现的效果 | 第63-66页 |
5.3 热点话题演化案例分析 | 第66-68页 |
5.3.1 话题演化的效果分析 | 第66-67页 |
5.3.2 子话题演化的效果分析 | 第67-68页 |
5.4 本章小结 | 第68-70页 |
第六章 结论 | 第70-72页 |
6.1 主要工作与创新点 | 第70-71页 |
6.2 进一步研究工作 | 第71-72页 |
致谢 | 第72-73页 |
参考文献 | 第73-78页 |
作者在学期间取得的学术成果 | 第78页 |