基于论坛的突发事件检测与跟踪
摘要 | 第3-4页 |
Abstract | 第4页 |
第一章 绪论 | 第8-12页 |
1.1 研究背景与意义 | 第8-9页 |
1.2 国内外研究现状 | 第9-10页 |
1.3 论文主要工作 | 第10页 |
1.4 论文组织结构 | 第10-12页 |
第二章 突发事件话题与相关对象的定义 | 第12-16页 |
2.1 对象的定义 | 第12-14页 |
2.2 研究框架思路图 | 第14-16页 |
第三章 数据库构建和数据预处理 | 第16-22页 |
3.1 数据库软件介绍的设计 | 第16页 |
3.2 数据库表设计 | 第16-18页 |
3.3 数据预处理 | 第18-22页 |
3.3.1 重复文档过滤 | 第18-19页 |
3.3.2 文档分词与建立自定义词库 | 第19-22页 |
第四章 突发词的提取与相似性矩阵的构建 | 第22-33页 |
4.1 时间窗、词的时序序列与TFIW-IDF | 第22-25页 |
4.2 用TFlW-IDF检测突事件突发词 | 第25-27页 |
4.3 计算突发词突发时间区间 | 第27-29页 |
4.5 构建词的共现度矩阵 | 第29-33页 |
4.5.1 词的内容共现度计算 | 第29-30页 |
4.5.2 词的时间共现度计算 | 第30-31页 |
4.5.3 基于内容和时间的共现相似矩阵 | 第31-33页 |
第五章 突发事件话题发现 | 第33-43页 |
5.1 聚类算法与突发事件话题发现框架 | 第33-38页 |
5.2 计算话题的突发时间区间 | 第38-40页 |
5.3 源数据与话题的对应 | 第40-43页 |
第六章 总结与展望 | 第43-46页 |
6.1 全文工作总结 | 第43页 |
6.2 下一步工作计划 | 第43-46页 |
参考文献 | 第46-47页 |
致谢 | 第47页 |