首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LDA模型的中文微博主题挖掘

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-15页
    1.1 研究背景及意义第9-10页
        1.1.1 研究背景第9页
        1.1.2 研究意义第9-10页
    1.2 相关研究现状第10-12页
        1.2.1 主题挖掘技术的研究现状第10-11页
        1.2.2 微博主题挖掘的研究现状第11-12页
    1.3 本文主要研究工作第12-13页
    1.4 论文组织结构第13-15页
第二章 相关理论与技术介绍第15-26页
    2.1 LDA模型相关知识第15-21页
        2.1.1 参数估计方法第15-19页
        2.1.2 Dirichlet分布与共轨分布第19页
        2.1.3 文本建模第19-21页
    2.2 数据采集与预处理技术第21-25页
        2.2.1 数据采集技术第21-24页
        2.2.2 预处理技术第24-25页
    2.3 本章总结第25-26页
第三章 基于改进LDA模型的微博主题发现第26-46页
    3.1 LDA模型概述第26-31页
        3.1.1 LDA基本原理第26-28页
        3.1.2 LDA的Gibbs采样推导第28-31页
    3.2 MB-WLDA模型第31-36页
        3.2.1 微博数据特征分析第31-33页
        3.2.2 MB-WLDA模型第33-36页
    3.3 微博主题挖掘的流程第36-39页
        3.3.1 整体流程第36-38页
        3.3.2 主题排序算法第38-39页
    3.4 实验结果与分析第39-45页
        3.4.1 基于困惑度的性能分析第40-41页
        3.4.2 实验效果分析第41-45页
    3.5 本章总结第45-46页
第四章 微博主题挖掘并行化的研究与实现第46-63页
    4.1 Hadoop技术第46-49页
        4.1.1 Apache Hadoop体系结构第46-47页
        4.1.2 MapReduce编程模型第47-48页
        4.1.3 分布式文件系统HDFS第48-49页
    4.2 并行MB-WLDA模型第49-51页
    4.3 微博主题挖掘并行处理的实现第51-58页
        4.3.1 词表生成模块第51-53页
        4.3.2 MB-WLDA初始化模块第53-55页
        4.3.3 Gibbs采样模块第55-58页
    4.4 实验结果与分析第58-62页
        4.4.1 试验环境第58-59页
        4.4.2 实验数据与参数设置第59页
        4.4.3 效率评估实验第59-60页
        4.4.4 可拓展性实验第60-62页
    4.5 本章总结第62-63页
第五章 总结与展望第63-65页
    5.1 论文总结第63-64页
    5.2 下一步的研究工作第64-65页
参考文献第65-68页
致谢第68-69页
攻读学位期间发表或己录用的学术论文第69页

论文共69页,点击 下载论文
上一篇:机器学习在影视大数据分析中的研究及应用
下一篇:基于Node.js的即时消息系统设计与实现