基于微博的网络热点发现研究

摘要	第1-3页
Abstract	第3-9页
第1章绪论	第9-15页
·研究背景及意义	第9-11页
·国内外相关研究	第11-13页
·话题发现与跟踪的相关研究	第11-12页
·网络舆情研究	第12-13页
·短文本相关研究	第13页
·本文研究内容	第13-14页
·论文组织安排	第14-15页
第2章相关技术	第15-29页
·Web 文本挖掘技术	第15-18页
·文本挖掘所用到的关键技术	第16-18页
·文本聚类	第18-22页
·文本模型分析	第18-20页
·主要聚类算法分析	第20-22页
·数据采集及提取技术	第22-26页
·网络爬虫	第22-25页
·页面抽取技术	第25-26页
·分词技术	第26-29页
第3章短文本聚类模型	第29-37页
·常规文本聚类模型	第29-30页
·短文本特性分析	第30-32页
·短文本聚类模型的提出	第32-33页
·具体功能分析	第33-37页
第4章基于短文本的聚类过程	第37-49页
·会话抽取	第37-42页
·短文本信息流的基本特征	第37-38页
·相关算法介绍	第38页
·相关性度量及 RMR	第38-41页
·算法描述	第41-42页
·相似性计算	第42-44页
·问题描述	第42页
·相关技术分析	第42-43页
·改进的相似性度量算法 TF-IDF	第43-44页
·混合聚类算法	第44-49页
·基于频繁词集的聚类方法	第44-45页
·k-means 算法	第45-46页
·混合聚类算法	第46-49页
第5章实验分析	第49-59页
·实验设置	第49页
·实验评测指标	第49-50页
·准确率与召回率	第49-50页
·测试数据的采集	第50-53页
·实验结果分析	第53-59页
·会话抽取分析	第53-55页
·聚类分析	第55-59页
总结与展望	第59-61页
参考文献	第61-65页
攻读硕士学位期间发表的论文	第65-67页
致谢	第67-68页
详细摘要	第68-72页