基于论坛的突发事件检测与跟踪
| 摘要 | 第3-4页 |
| Abstract | 第4页 |
| 第一章 绪论 | 第8-12页 |
| 1.1 研究背景与意义 | 第8-9页 |
| 1.2 国内外研究现状 | 第9-10页 |
| 1.3 论文主要工作 | 第10页 |
| 1.4 论文组织结构 | 第10-12页 |
| 第二章 突发事件话题与相关对象的定义 | 第12-16页 |
| 2.1 对象的定义 | 第12-14页 |
| 2.2 研究框架思路图 | 第14-16页 |
| 第三章 数据库构建和数据预处理 | 第16-22页 |
| 3.1 数据库软件介绍的设计 | 第16页 |
| 3.2 数据库表设计 | 第16-18页 |
| 3.3 数据预处理 | 第18-22页 |
| 3.3.1 重复文档过滤 | 第18-19页 |
| 3.3.2 文档分词与建立自定义词库 | 第19-22页 |
| 第四章 突发词的提取与相似性矩阵的构建 | 第22-33页 |
| 4.1 时间窗、词的时序序列与TFIW-IDF | 第22-25页 |
| 4.2 用TFlW-IDF检测突事件突发词 | 第25-27页 |
| 4.3 计算突发词突发时间区间 | 第27-29页 |
| 4.5 构建词的共现度矩阵 | 第29-33页 |
| 4.5.1 词的内容共现度计算 | 第29-30页 |
| 4.5.2 词的时间共现度计算 | 第30-31页 |
| 4.5.3 基于内容和时间的共现相似矩阵 | 第31-33页 |
| 第五章 突发事件话题发现 | 第33-43页 |
| 5.1 聚类算法与突发事件话题发现框架 | 第33-38页 |
| 5.2 计算话题的突发时间区间 | 第38-40页 |
| 5.3 源数据与话题的对应 | 第40-43页 |
| 第六章 总结与展望 | 第43-46页 |
| 6.1 全文工作总结 | 第43页 |
| 6.2 下一步工作计划 | 第43-46页 |
| 参考文献 | 第46-47页 |
| 致谢 | 第47页 |