微博数据提取及话题检测方法研究
摘要 | 第1-5页 |
Abstract | 第5-8页 |
1 绪论 | 第8-12页 |
·研究背景 | 第8-9页 |
·研究现状 | 第9-10页 |
·研究内容及意义 | 第10页 |
·研究内容 | 第10页 |
·研究意义 | 第10页 |
·论文组织结构 | 第10-12页 |
2 相关背景知识简介 | 第12-18页 |
·微博 | 第12-15页 |
·微博及其特性 | 第12-15页 |
·微博在生活中的作用 | 第15页 |
·数据挖掘 | 第15-17页 |
·数据挖掘的主要任务 | 第16页 |
·数据挖掘的主要步骤 | 第16-17页 |
·WEB挖掘 | 第17-18页 |
3 微博数据提取方法研究 | 第18-36页 |
·常用网络信息采集方法 | 第18-24页 |
·利用API提取微博数据方法研究 | 第24-36页 |
·开放平台简要介绍 | 第24-25页 |
·OAuth 1.0与OAuth 2.0协议分析 | 第25-30页 |
·利用开放API获取微博数据 | 第30-36页 |
4 微博话题检测方法研究 | 第36-49页 |
·常用话题检测算法流程 | 第36-44页 |
·话题数据的提取及前期处理 | 第36-37页 |
·模型化方式表示文本 | 第37-40页 |
·计算文本相似度 | 第40-41页 |
·选择聚类算法 | 第41-44页 |
·微博文本的建模 | 第44-45页 |
·微博数据的预处理 | 第44页 |
·构建文本模型,特征项及特征权重 | 第44-45页 |
·微博话题检测算法 | 第45-49页 |
·话题相似度计算 | 第45-47页 |
·话题检测流程 | 第47-49页 |
5 实验及结果分析 | 第49-54页 |
·获取方式及存储方式比较 | 第49-50页 |
·采集数据 | 第50页 |
·实验评价标准 | 第50-51页 |
·相似度参数及时间参数的确定 | 第51-52页 |
·不同检测算法比较 | 第52-53页 |
·不同相似度算法比较 | 第53-54页 |
结论 | 第54-55页 |
参考文献 | 第55-57页 |
攻读硕士学位期间发表学术论文情况 | 第57-58页 |
致谢 | 第58-59页 |