突发事件检测和预测方法研究

摘要	第3-4页
ABSTRACT	第4-5页
第1章绪论	第8-14页
1.1 研究背景	第8-10页
1.2 研究目标	第10-11页
1.3 研究内容	第11页
1.4 研究现状	第11-12页
1.5 论文的组织结构	第12-14页
第2章相关工作	第14-22页
2.1 话题检测与跟踪技术	第14-15页
2.2 生物成长理论	第15-17页
2.2.1 生物成长理论基本概念	第15-16页
2.2.2 营养衰减因子改进	第16页
2.2.3 营养转化因子改进	第16-17页
2.3 文本表示模型	第17-19页
2.3.1 向量空间模型	第17页
2.3.2 概率检索模型	第17-18页
2.3.3 词汇链模型	第18页
2.3.4 图模型	第18页
2.3.5 文本的分布式表示	第18-19页
2.4 文本特征提取	第19-22页
2.4.1 TF-IDF	第19页
2.4.2 互信息	第19页
2.4.3 期望交叉熵法	第19-20页
2.4.4 卡方统计量法	第20页
2.4.5 自编码器	第20-22页
第3章基于AT的突发事件检测方法	第22-34页
3.1 检测方法框架概述	第22-23页
3.2 新闻数据获取与预处理	第23-25页
3.2.1 通过网络爬虫获取新闻	第23页
3.2.2 降噪、去重和编码处理	第23-24页
3.2.3 中文分词与去停用词	第24-25页
3.3 文本表示、特征提取	第25-27页
3.3.1 向量空间模型	第25-26页
3.3.2 向量表示文本(Doc2Vec)	第26-27页
3.4 相似度计算	第27页
3.5 改进Single-Pass聚类算法	第27-29页
3.6 实验结果与分析	第29-31页
3.6.1 评估方法与初始语料库	第29-30页
3.6.2 数据来源	第30页
3.6.3 ETCBS实验结果与对比	第30-31页
3.7 Doc2Vec做特征表示的实验结果	第31-33页
3.8 本章小结	第33-34页
第4章突发事件预测方法	第34-46页
4.1 基于增长率的预测方法	第34-39页
4.1.1 增长率预测方法分析	第35-38页
4.1.2 改进的增长率预测方法	第38-39页
4.2 基于时间序列的生物成长曲线拟合方法	第39-40页
4.3 实验分析	第40-45页
4.3.1 增长率预测实验	第40-42页
4.3.2 曲线拟合实验	第42-45页
4.4 本章小结	第45-46页
第5章总结与展望	第46-48页
5.1 总结	第46页
5.2 展望	第46-48页
参考文献	第48-51页
附录	第51-52页
发表论文和参加科研情况说明	第52-53页
致谢	第53页