首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Spark并行LDA主题模型的研究

中文摘要第3-4页
英文摘要第4页
1 绪论第8-14页
    1.1 研究背景、目的及意义第8-9页
    1.2 国内外研究现状第9-12页
        1.2.1 主题模型发展情况第9-11页
        1.2.2 并行化LDA的研究现状第11-12页
    1.3 论文的主要研究内容及创新之处第12页
        1.3.1 论文的主要研究内容第12页
    1.4 论文的组织结构第12-14页
2 相关理论知识第14-27页
    2.1 LDA相关知识第14-22页
        2.1.1 贝叶斯估计第14页
        2.1.2 共轭分布第14-16页
        2.1.3 Gibbs采样第16-22页
    2.2 Spark简介第22-26页
        2.2.1 Spark框架第22页
        2.2.2 RDD第22-24页
        2.2.3 Spark任务调度第24-26页
        2.2.4 Spark的容错性第26页
    2.3 本章小结第26-27页
3 基于Spark的主题模型第27-53页
    3.1 传统主题模型第27-30页
    3.2 基本LDA模型第30-39页
        3.2.1 LDA主题模型第30-33页
        3.2.2 Gibbs采样方法求解LDA模型第33-37页
        3.2.3 LDA模型的训练和推断第37-39页
    3.3 并行化LDA算法第39-43页
        3.3.1 AD-LDA算法第39-41页
        3.3.2 基于AD-LDA的算法改进第41-43页
    3.4 AD-LDA改进算法实现第43-47页
    3.5 基于Spark实现改进算法第47-52页
    3.6 本章小结第52-53页
4 实验分析第53-62页
    4.1 实验环境第53-55页
        4.1.1 硬件环境第53页
        4.1.2 软件环境第53-54页
        4.1.3 数据来源第54-55页
    4.2 模型评价指标第55-56页
    4.3 实验参数第56页
    4.4 实验过程及结果分析第56-60页
        4.4.1 收敛速度第56-58页
        4.4.2 困惑度第58-59页
        4.4.3 加速比第59-60页
    4.5 本章小结第60-62页
5 总结与展望第62-64页
    5.1 论文工作总结第62页
    5.2 下一步工作展望第62-64页
致谢第64-65页
参考文献第65-68页

论文共68页,点击 下载论文
上一篇:中医内外合治COPD稳定期患者临床疗效观察
下一篇:脂必泰联合辛伐他汀对稳定性冠心病者颈动脉斑块的影响