首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

微博数据预处理及话题检测方法研究

摘要第1-5页
Abstract第5-7页
目录第7-10页
1 绪论第10-21页
   ·课题来源及意义第10-11页
   ·微博第11-15页
     ·微博定义第11-13页
     ·微博的产生与发展第13-14页
     ·微博特点第14-15页
   ·话题检测第15-16页
     ·基本概念第15页
     ·发展历程第15-16页
   ·微博话题检测方法研究框架第16页
   ·相关技术国内外研究现状第16-20页
     ·短文本预处理研究现状第16-17页
     ·话题检测技术研究现状第17-18页
     ·微博相关研究现状第18-20页
   ·论文主要研究内容与结构安排第20-21页
2 微博数据信息采集第21-32页
   ·基于网络爬虫的数据获取第21-24页
     ·网络爬虫基本概念第21页
     ·通用网络爬虫第21-22页
     ·主题网络爬虫第22-24页
   ·基于开放平台 API 的数据获取第24-30页
     ·新浪微博开放平台 API第24-25页
     ·OAuth 用户身份认证第25-26页
     ·新浪微博 API 数据获取流程第26页
     ·微博开放 API 获取数据具体过程第26-30页
   ·实验对比与总结第30-31页
   ·本章小结第31-32页
3 微博短文本预处理第32-47页
   ·使用多种语言增加短文本特征数量第32-33页
     ·微博短文本存在的问题第32页
     ·使用多种语言进行特征扩展第32-33页
   ·问题形式化描述第33页
   ·短文本特征扩展第33-39页
     ·多语言知识整合框架第34-36页
     ·整合框架的优化方法第36-38页
     ·算法时间复杂度分析第38-39页
   ·实验评估与分析第39-46页
     ·实验数据准备第39-40页
     ·聚类方法和评估标准第40页
     ·决定性潜在维数第40-41页
     ·外在扩充知识的作用第41-43页
     ·语言种类数量的影响第43-44页
     ·算法分析第44-46页
   ·本章小结第46-47页
4 微博话题检测方法第47-60页
   ·微博话题检测方法思想第47-49页
     ·传统话题检测技术第47页
     ·微博话题检测技术分析第47-48页
     ·话题检测方法总体框架第48-49页
   ·微博话题检测方法过程第49-55页
     ·微博数据的预处理第49页
     ·微博文本的建模第49-51页
     ·话题相似度计算第51-52页
     ·话题检测算法流程第52-55页
   ·实验结果与分析第55-59页
     ·微博数据采集及预处理第55-56页
     ·实验评价标准第56-57页
     ·不同检测算法的比较实验第57-59页
   ·本章小结第59-60页
5 总结与展望第60-62页
   ·总结第60页
   ·展望第60-62页
参考文献第62-66页
致谢第66-67页
攻读学位期间取得的科研成果清单第67页

论文共67页,点击 下载论文
上一篇:基于Android+Java EE的设备监测和台站设备信息管理系统
下一篇:基于加权向量提升的多尺度聚类挖掘算法