首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于容错粗糙集的微博热点话题发现研究

摘要第1-4页
Abstract第4-9页
第一章 绪论第9-15页
 第一节 研究的背景与意义第9页
 第二节 国内外相关研究综述第9-13页
  一、 话题检测与追踪的研究现状第9-11页
  二、 微博热点话题发现的研究现状第11-12页
  三、 现有研究的不足及本文提出方法第12-13页
 第三节 主要研究内容第13-15页
  一、 主要工作第13页
  二、 论文结构安排第13-15页
第二章 相关理论及关键技术介绍第15-25页
 第一节 容错粗糙集模型第15-17页
 第二节 微博特征第17-20页
  一、 微博平台第18-19页
  二、 微博文本信息特征第19-20页
  三、 微博平台信息传播特征第20页
 第三节 话题检测与追踪第20-25页
  一、 相关概念第21页
  二、 话题模型第21-23页
  三、 话题发现算法第23页
  四、 话题检测评测标准第23-25页
第三章 基于微博特征的容错粗糙集文本表示模型第25-32页
 第一节 微博热点话题第25-26页
  一、 微博热点话题表现形式及传播特征第25-26页
  二、 微博热点话题文本表示模型第26页
 第二节 扩展的容错粗糙集文本表示模型第26-32页
  一、 建立微博信息关系树第27-28页
  二、 基于微博特征扩展的容错粗糙集模型第28-30页
  三、 文本特征项的扩展表示第30页
  四、 特征项权重的扩展计算第30-32页
第四章 微博热点话题发现第32-45页
 第一节 新浪微博信息采集第32-36页
  一、 基于 Heritrix 的微博信息获取第33-34页
  二、 基于新浪微博 API 的信息获取第34-35页
  三、 微博信息解析第35-36页
 第二节 微博文本预处理第36-39页
  一、 分词和词性标注第36-38页
  二、 停用词去除第38-39页
  三、 特征项选取第39页
 第三节 微博文档集文本表示模型第39-41页
  一、 特征项容错类算法第39-40页
  二、 计算权重第40页
  三、 微博消息表示模型第40-41页
 第四节 聚类算法分析第41-43页
  一、 增量式聚类和层次聚类算法第41页
  二、 K-means 算法第41-42页
  三、 IAHC&K-means 聚类算法第42-43页
 第五节 微博话题热度评价第43-45页
  一、 微博用户关注程度第43页
  二、 微博消息时效性第43-44页
  三、 话题热度计算公式第44-45页
第五章 实验与分析第45-49页
 第一节 数据集第45页
 第二节 实验及分析第45-49页
第六章 总结与展望第49-50页
参考文献第50-54页
致谢第54-55页
在读期间的研究成果第55页

论文共55页,点击 下载论文
上一篇:基于非线性库存和软时间窗的物流网络优化研究
下一篇:基于物联网技术的糖尿病管理信息系统研究