首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

微博健康热点话题发现系统的设计与实现

摘要第3-4页
abstract第4-5页
1 绪论第8-14页
    1.1 研究背景与意义第8-9页
    1.2 国内外研究现状第9-10页
        1.2.1 国外研究现状第9页
        1.2.2 国内研究现状第9-10页
    1.3 论文研究内容第10-11页
    1.4 本文组织结构第11-14页
2 相关理论和技术介绍第14-28页
    2.1 微博健康话题发现概述第14-16页
    2.2 话题发现与跟踪介绍第16-17页
    2.3 话题发现的关键技术第17-27页
        2.3.1 文本模型表示第18-21页
        2.3.2 话题相似度的计算第21-23页
        2.3.3 话题聚类算法的选择第23-26页
        2.3.4 话题聚类评价方法第26-27页
    2.4 本章小结第27-28页
3 基于VSM和MLDA模型相结合的微博话题发现算法第28-42页
    3.1 传统话题发现方法的局限性第28-29页
    3.2 LDA模型介绍第29-31页
        3.2.1 LDA模型的主题挖掘第29-30页
        3.2.2 LDA模型原理第30-31页
    3.3 MLDA模型的引出第31-34页
        3.3.1 MLDA模型介绍第31-33页
        3.3.2 MLDA模型文档生成原理第33-34页
    3.4 基于VSM和MLDA模型相结合的微博健康话题发现算法第34-41页
        3.4.1 算法思想第34-36页
        3.4.2 微博文本的VSM和MLDA建模第36-37页
        3.4.3 微博文本初次聚类第37-39页
        3.4.4 子话题合并第39-41页
    3.5 本章小结第41-42页
4 微博健康话题发现系统的设计与实现第42-56页
    4.1 系统总体设计框架第42-44页
    4.2 数据采集与预处理模块第44-46页
        4.2.1 微博内容爬取第44-45页
        4.2.2 用户信息抓取第45页
        4.2.3 微博数据的预处理第45-46页
    4.3 微博数据存取模块第46-47页
        4.3.1 微博数据第46页
        4.3.2 用户数据第46-47页
        4.3.3 子话题数据第47页
        4.3.4 热点话题数据第47页
    4.4 微博话题发现模块第47-52页
        4.4.1 二次聚类算法的准备工作第48页
        4.4.2 初次聚类-改进的Single-pass聚类第48-50页
        4.4.3 二次聚类-AGNES层次聚类第50-52页
    4.5 话题热度计算模块第52-53页
        4.5.1 用户影响力第52-53页
        4.5.2 微博热度第53页
        4.5.3 子话题热度第53页
        4.5.4 话题热度第53页
    4.6 热点话题展示第53-54页
    4.7 本章小结第54-56页
5 实验与分析第56-62页
    5.1 实验环境第56页
    5.2 实验过程第56-61页
        5.2.1 话题发现算法实验对比第56-57页
        5.2.2 微博热点话题发展趋势分析第57-58页
        5.2.3 性能测试第58-61页
    5.3 本章小结第61-62页
6 总结与展望第62-63页
    6.1 工作总结第62页
    6.2 未来展望第62-63页
致谢第63-64页
参考文献第64-66页

论文共66页,点击 下载论文
上一篇:基于BQ-Apriori算法的混合推荐系统研究
下一篇:基于属性选择加权的朴素贝叶斯算法的改进与应用