首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

微博热点话题发现问题的研究及实现

中文摘要第3-4页
Abstract第4-5页
第一章 绪论第8-13页
    1.1 研究背景及意义第8页
    1.2 国内外研究现状第8-10页
        1.2.1 国外研究现状第9页
        1.2.2 国内研究现状第9-10页
    1.3 论文研究内容第10-11页
    1.4 论文的组织结构第11-13页
第2章 相关理论与技术第13-31页
    2.1 Hadoop框架介绍第13-17页
        2.1.1 HDFS分布式文件系统第13-14页
        2.1.2 MapReduce并行编程框架第14-16页
        2.1.3 Mahout算法库第16-17页
    2.2 微博数据采集技术第17-21页
        2.2.1 网络爬虫第17-18页
        2.2.2 RESTful Web API第18-19页
        2.2.3 开放认证OAuth2.0协议第19-20页
        2.2.4 分布式采集第20-21页
    2.3 文本处理和表示第21-24页
        2.3.1 文本预处理第21-22页
        2.3.2 文本特征提取第22-23页
        2.3.3 文本表示第23-24页
    2.4 文本聚类算法第24-28页
        2.4.1 基于划分的K-means聚类算法第24-25页
        2.4.2 基于密度的DBSCAN聚类算法第25-27页
        2.4.3 基于层次聚类算法第27-28页
    2.5 话题发现算法综述第28-31页
        2.5.1 基于热词抽取并聚类的方法第28-29页
        2.5.2 基于向量空间模型并聚类的方法第29页
        2.5.3 基于潜在语义分析的方法第29-31页
第3章 微博数据采集、存储及预处理第31-48页
    3.1 微博简介第31-32页
    3.2 微博数据分析第32-34页
        3.2.1 微博信息特点第32-33页
        3.2.2 微博传播特点第33-34页
    3.3 微博数据采集第34-40页
        3.3.1 新浪微博开放平台第35页
        3.3.2 新浪微博数据采集第35-40页
    3.4 微博数据存储第40-44页
        3.4.1 HBase存储第40-43页
        3.4.2 MySQL数据库存储第43-44页
    3.5 微博数据预处理第44-47页
        3.5.1 微博垃圾过滤第44-45页
        3.5.2 中文分词第45-46页
        3.5.3 停用词过滤第46-47页
    3.6 本章小结第47-48页
第4章 分布式微博热点话题的发现方法第48-67页
    4.1 基本思想和框架第48-49页
    4.2 隐主题建模第49-56页
        4.2.1 LDA模型介绍第49-51页
        4.2.2 基于LDA建模第51-56页
    4.3 基于Canopy+ K-means算法的聚类第56-60页
        4.3.1 基于Canopy算法的初步聚类第56-58页
        4.3.2 基于MapReduce的K-means聚类第58-60页
    4.4 话题热度的定义和计算第60-61页
    4.5 话题关键词集的提取方法第61-62页
    4.6 实验结果和分析第62-65页
        4.6.1 实验环境第62页
        4.6.2 实验评估指标第62-64页
        4.6.3 实验数据第64页
        4.6.4 实验结果及分析第64-65页
    4.7 本章小结第65-67页
第5章 基于Hadoop的微博热点话题发现平台第67-75页
    5.1 平台框架展示第67页
    5.2 平台环境部署第67-70页
        5.2.1 平台环境第68-69页
        5.2.2 平台部署第69-70页
    5.3 平台各层及主要模块第70-74页
        5.3.1 数据采集及存储层第70-72页
        5.3.2 数据预处理层第72页
        5.3.3 热点话题发现层第72-73页
        5.3.4 热点话题展示层第73-74页
    5.4 本章小结第74-75页
总结与展望第75-77页
参考文献第77-81页
致谢第81-82页
个人简历第82-83页
在学期间的研究成果及发表的学术论文第83页

论文共83页,点击 下载论文
上一篇:出版资源采集系统的设计与实现
下一篇:恒温槽自动校准装置的研究