首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于微博的网络热点发现研究

摘要第1-3页
Abstract第3-9页
第1章 绪论第9-15页
   ·研究背景及意义第9-11页
   ·国内外相关研究第11-13页
     ·话题发现与跟踪的相关研究第11-12页
     ·网络舆情研究第12-13页
     ·短文本相关研究第13页
   ·本文研究内容第13-14页
   ·论文组织安排第14-15页
第2章 相关技术第15-29页
   ·Web 文本挖掘技术第15-18页
     ·文本挖掘所用到的关键技术第16-18页
   ·文本聚类第18-22页
     ·文本模型分析第18-20页
     ·主要聚类算法分析第20-22页
   ·数据采集及提取技术第22-26页
     ·网络爬虫第22-25页
     ·页面抽取技术第25-26页
   ·分词技术第26-29页
第3章 短文本聚类模型第29-37页
   ·常规文本聚类模型第29-30页
   ·短文本特性分析第30-32页
   ·短文本聚类模型的提出第32-33页
   ·具体功能分析第33-37页
第4章 基于短文本的聚类过程第37-49页
   ·会话抽取第37-42页
     ·短文本信息流的基本特征第37-38页
     ·相关算法介绍第38页
     ·相关性度量及 RMR第38-41页
     ·算法描述第41-42页
   ·相似性计算第42-44页
     ·问题描述第42页
     ·相关技术分析第42-43页
     ·改进的相似性度量算法 TF-IDF第43-44页
   ·混合聚类算法第44-49页
     ·基于频繁词集的聚类方法第44-45页
     ·k-means 算法第45-46页
     ·混合聚类算法第46-49页
第5章 实验分析第49-59页
   ·实验设置第49页
   ·实验评测指标第49-50页
     ·准确率与召回率第49-50页
   ·测试数据的采集第50-53页
   ·实验结果分析第53-59页
       ·会话抽取分析第53-55页
       ·聚类分析第55-59页
总结与展望第59-61页
参考文献第61-65页
攻读硕士学位期间发表的论文第65-67页
致谢第67-68页
详细摘要第68-72页

论文共72页,点击 下载论文
上一篇:基因表达谱数据聚类算法的研究
下一篇:基于ERP和KDD的企业管理系统的设计与应用