基于优化TF-IDF与词共现的微博热点话题发现研究

摘要	第3-4页
abstract	第4-5页
第1章绪论	第8-14页
1.1 选题背景与研究意义	第8-9页
1.2 国内外研究现状	第9-11页
1.2.1 国内研究现状	第9-10页
1.2.2 国外研究现状	第10-11页
1.3 本文研究内容	第11-12页
1.4 本文组织架构	第12-14页
第2章微博热点发现相关理论与技术	第14-24页
2.1 微博概述	第14-15页
2.1.1 微博文本特点	第14-15页
2.1.2 微博挖掘方向	第15页
2.2 中文分词技术	第15-18页
2.2.1 中文分词技术分类	第15-16页
2.2.2 N-Gram模型	第16-18页
2.3 文本特征选择	第18-19页
2.3.1 TF-IDF算法	第18页
2.3.2 词共现模型	第18-19页
2.4 文本表示模型	第19-20页
2.5 文本聚类算法	第20-23页
2.6 本章小结	第23-24页
第3章基于优化TF-IDF与词共现的微博热点话题发现	第24-40页
3.1 微博热点话题发现流程	第24-26页
3.2 微博筛选和微博排序	第26-27页
3.3 文本分词处理	第27-33页
3.3.1 文本预处理	第27页
3.3.2 新词发现规则的制定	第27-31页
3.3.3 基于规则和N-Gram模型发现新词	第31-32页
3.3.4 微博文本词集获取	第32-33页
3.4 主题词提取	第33-37页
3.4.1 TF-IDF算法优化	第33-34页
3.4.2 基于优化的TF-IDF和词共现模型提取主题词	第34-37页
3.5 微博话题热度值计算	第37-39页
3.5.1 热度值计算	第37-38页
3.5.2 基于热度值的微博热点话题发现	第38-39页
3.6 本章小结	第39-40页
第4章实验过程及结果分析	第40-51页
4.1 实验平台	第40页
4.2 实验效果评价指标	第40-41页
4.3 实验验证与分析	第41-50页
4.3.1 实验数据采集与预处理	第41-43页
4.3.2 实验过程与结果分析	第43-50页
4.4 本章小结	第50-51页
第5章总结与展望	第51-53页
5.1 本文总结	第51-52页
5.2 展望未来	第52-53页
致谢	第53-54页
参考文献	第54-57页
攻读学位期间的研究成果	第57页