基于论坛的热点话题识别与趋势预测研究

摘要	第2-4页
Abstract	第4-5页
第1章绪论	第8-12页
1.1 研究背景及意义	第8页
1.2 国内外现状	第8-10页
1.2.1 话题检测	第9-10页
1.2.2 话题预测分析	第10页
1.3 本文研究内容	第10-11页
1.4 论文组织结构	第11-12页
第2章相关技术及原理	第12-26页
2.1 论坛数据的采集与处理	第12-17页
2.1.1 爬虫的概念	第12页
2.1.2 原理	第12-14页
2.1.3 关键部分	第14-17页
2.2 热点话题检测	第17-24页
2.2.1 热点话题的描述	第18页
2.2.2 文本表示模型	第18-19页
2.2.3 文本特征提取	第19-22页
2.2.4 文本相似度计算	第22-23页
2.2.5 文本聚类	第23-24页
2.3 本章小结	第24-26页
第3章热点话题识别	第26-39页
3.1 文本预处理	第26-29页
3.1.1 中文分词	第26-27页
3.1.2 停用词的处理	第27-28页
3.1.3 特征提取	第28-29页
3.2 热点话题检测	第29-35页
3.2.1 多向量表示模型	第29-30页
3.2.2 相似度计算	第30-32页
3.2.3 基于二次聚类的话题检测	第32-35页
3.3 实验及结果分析	第35-38页
3.3.1 实验环境	第35页
3.3.2 实验数据	第35-36页
3.3.3 评判标准	第36-37页
3.3.4 结果分析	第37-38页
3.4 本章小结	第38-39页
第4章热点话题的预测分析	第39-49页
4.1 ARIMA模型	第39-44页
4.1.1 ARIMA模型介绍	第39-40页
4.1.2 建模步骤	第40-41页
4.1.3 模型识别和参数估计	第41-42页
4.1.4 模型的检验	第42-43页
4.1.5 模型预测	第43-44页
4.2 实验结果分析	第44-48页
4.2.1 实验环境	第44页
4.2.2 实验数据	第44页
4.2.3 实验步骤以及分析	第44-48页
4.3 本章小结	第48-49页
第5章结论与展望	第49-51页
5.1 总结	第49-50页
5.2 进一步工作的方向	第50-51页
参考文献	第51-53页
致谢	第53-55页
附件	第55页