首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于分布式MBUT-LDA的微博用户主题挖掘

摘要第3-4页
ABSTRACT第4页
1 绪论第7-15页
    1.1 问题的提出第7页
    1.2 国内外研究现状第7-11页
        1.2.1 传统的主题挖掘算法第7-8页
        1.2.2 基于线性代数的主题挖掘算法第8页
        1.2.3 基于概率模型的主题挖掘算法第8-11页
    1.3 课题研究的主要内容第11-13页
    1.4 本文的组织结构第13页
    1.5 本章小结第13-15页
2 相关技术基础第15-35页
    2.1 主题模型相关技术第15-26页
        2.1.1 参数估计第15-17页
        2.1.2 共轭分布第17-19页
        2.1.3 文本建模第19-20页
        2.1.4 贝叶斯网络和生成模型第20-22页
        2.1.5 狄利克雷分配第22-26页
    2.2 Hadoop 分布式平台第26-34页
        2.2.1 “云计算”概述第26-27页
        2.2.2 Hadoop 架构第27-28页
        2.2.3 MapReduce 引擎第28-31页
        2.2.4 Hadoop 分布式文件系统(HDFS)第31-33页
        2.2.5 HDFS 的工作流程第33-34页
    2.3 本章小结第34-35页
3 基于微博的主题模型建模第35-57页
    3.1 建模方法第35-40页
        3.1.1 基于传统的 LDA 建模方法第35-36页
        3.1.2 改进的微博主题建模方法 MBUT-LDA第36-40页
    3.2 MBUT-LDA 模型的推导第40-43页
    3.3 MBUT-LDA 模型的训练和 Inference第43-44页
    3.4 MBUT-LDA 主题建模算法实现第44-46页
    3.5 分布式的 MBUT-LDA 主题建模实现第46-54页
        3.5.1 词典生成过程第47-50页
        3.5.2 MBUT-LDA 初始化过程第50-52页
        3.5.3 Gibbs 抽样过程第52-53页
        3.5.4 挖掘用户主题第53-54页
    3.6 本章总结第54-57页
4 实验分析第57-69页
    4.1 实验准备第57-58页
        4.1.1 数据准备第57页
        4.1.2 数据处理第57页
        4.1.3 实验环境第57-58页
    4.2 实验评估第58-67页
        4.2.1 整体效果第58-59页
        4.4.2 有效性实验第59-64页
        4.4.3 时间效率实验第64-67页
    4.3 本章小结第67-69页
5 总结与展望第69-71页
    5.1 本文总结第69-70页
    5.2 下一步工作第70-71页
致谢第71-73页
参考文献第73-77页
附录第77页
    A. 作者在攻读硕士学位期间成果目录第77页
    B. 作者在攻读硕士学位期间参加的项目第77页

论文共77页,点击 下载论文
上一篇:贴片元件几何尺寸精密测量系统的关键技术研究
下一篇:基于改进蚁群算法的云计算资源分配研究