首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

并行LDA算法的研究与实现

摘要第4-5页
ABSTRACT第5页
第一章 绪论第8-13页
    1.1. 选题背景及意义第8-9页
    1.2. 相关研究现状第9-11页
    1.3. 本文的研究工作第11-12页
    1.4. 本文结构第12-13页
第二章 背景知识第13-27页
    2.1. LDA相关知识第13-23页
        2.1.1. 贝叶斯推断第13-14页
        2.1.2. Dirichlet分布第14-18页
        2.1.3. MCMC和Gibbs采样第18-23页
    2.2. Spark和MLlib简介第23-26页
    2.3. 本章小结第26-27页
第三章 使用Spark实现的并行LDA算法第27-43页
    3.1. LDA简介第27-33页
        3.1.1. LDA概率模型第27-29页
        3.1.2. 使用Gibbs采样推导LDA第29-33页
    3.2. Spark-LDA算法介绍第33-37页
        3.2.1. 算法思想第33-34页
        3.2.2. 数据分割及负载均衡第34-36页
        3.2.3. 数据处理流程第36-37页
    3.3. Spark-LDA实现第37-41页
    3.4. 算法存在的问题第41-42页
    3.5. 本章小结第42-43页
第四章 算法相关实验第43-52页
    4.1. 实验环境第43-44页
        4.1.1. 硬件环境第43页
        4.1.2. 软件环境第43页
        4.1.3. 数据来源第43-44页
    4.2. 过程及结果分析第44-50页
        4.2.1. 困惑度第44-48页
        4.2.2. 收敛速度第48页
        4.2.3. 加速比第48-50页
    4.3. 实验结论第50-51页
    4.4. 本章小结第51-52页
第五章 算法集成与应用第52-69页
    5.1. PDM系统简介第52-53页
    5.2. 算法集成第53-64页
        5.2.1. 需求分析第53-54页
        5.2.2. 概要设计第54-55页
        5.2.3. 详细设计与实现第55-63页
        5.2.4. 遇到的问题与解决方案第63-64页
    5.3. 主题提取第64-68页
        5.3.1. 数据来源第64-65页
        5.3.2. 数据预处理第65-66页
        5.3.3. 估计主题个数第66页
        5.3.4. 作业提交与结果展示第66-68页
    5.4. 本章小结第68-69页
第六章 总结与展望第69-71页
参考文献第71-73页
致谢第73-74页
攻读学位期间发表的学术论文目录第74页

论文共74页,点击 下载论文
上一篇:高管股权激励与盈余管理关系研究--基于应计盈余管理与真实盈余管理的实证研究
下一篇:独立审计质量对上市公司盈余管理影响的实证研究