首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于微博文本的话题聚类研究与实现

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-12页
   ·论文的研究背景及意义第8-9页
   ·国内外研究现状第9页
   ·本文主要的研究工作第9-10页
   ·论文结构第10-12页
第2章 相关工作综述第12-22页
   ·数据采集第12-13页
     ·概述第12页
     ·针对微博的数据采集第12-13页
   ·文本表示模型第13-14页
   ·文本聚类第14-20页
     ·概述第14-17页
     ·分词第17-18页
     ·特征向量第18-20页
   ·话题聚类第20-21页
   ·数据可视化第21页
   ·本章小结第21-22页
第3章 基于微博的话题聚类算法的研究与设计实现第22-36页
   ·算法的整体描述第22-24页
   ·文本预处理第24-27页
     ·数据清理第24-25页
     ·索引库的建立第25-26页
     ·文本分词技术第26-27页
   ·特征向量的提取与筛选第27-29页
     ·信息增益第27-28页
     ·特征向量的筛选第28-29页
   ·特征向量权重的计算第29-31页
     ·基于 VSM 的文本表示第30页
     ·TFIDF 算法第30-31页
   ·聚类实现第31-34页
     ·数据准备第31-33页
     ·K-means 算法第33-34页
     ·欧氏距离第34页
     ·曼哈顿距离第34页
   ·本章小结第34-36页
第4章 实验与性能分析第36-50页
   ·实验数据获取第36-37页
   ·微博数据特性第37页
   ·测试语料第37-38页
   ·算法评估标准第38-39页
   ·层次聚类与 K-means 聚类算法比较第39-40页
   ·欧式距离与曼哈顿距离第40-41页
   ·添加用户词典对聚类结果的影响第41-43页
   ·信息增益阈值选择第43-49页
   ·本章小结第49-50页
第5章 系统设计与实现第50-54页
   ·系统整体设计第50页
   ·系统构建第50-53页
   ·存在的问题与展望第53页
   ·本章小结第53-54页
结论第54-56页
参考文献第56-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:脉冲噪声和高斯噪声的混合图像噪声去噪研究
下一篇:基于搜索引擎优化的网站改进方案的设计