首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的应用可视化研究与实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-17页
    1.1 课题研究背景第9-11页
        1.1.1 大数据研究背景及现状第9-10页
        1.1.2 文本挖掘领域的研究及现状第10-11页
    1.2 分布式计算系统的研究及现状第11-12页
    1.3 文本聚类的研究及现状第12-15页
    1.4 论文主要工作第15页
    1.5 论文内容结构第15-17页
第二章 关键技术介绍第17-33页
    2.1 Hadoop平台第17-24页
        2.1.1 HDFS(Hadoop分布式文件系统)第17-19页
        2.1.2 MapReduce(分布式计算框架)第19-22页
        2.1.3 Sqoop(Hadoop传输工具)第22-24页
    2.2 LDA主题模型相关研究第24-31页
        2.2.1 概率主题模型第24-26页
        2.2.2 LDA模型第26-28页
        2.2.3 Gibbs抽样近似计算LDA第28-29页
        2.2.4 Gibbs更新法则第29-30页
        2.2.5 Gibbs抽样算法第30-31页
    2.3 本章小结第31-33页
第三章 基于Hadoop的分布式LDA算法与优化第33-57页
    3.1 分布式LDA主题模型第33-34页
        3.1.1 分布式LDA的可行性第33-34页
        3.1.2 主流分布式LDA模型框架第34页
    3.2 基于Hadoop的分布式LDA实现与优化第34-44页
        3.2.1 优化后分布式LDA框架第34-36页
        3.2.2 词典生成模块优化第36-38页
        3.2.3 模型初始化第38-39页
        3.2.4 模型参数融合第39-40页
        3.2.5 分布式Gibbs抽样第40-41页
        3.2.6 自定义类型第41-42页
        3.2.7 序列化文件第42-44页
        3.2.8 中断重建的实现第44页
    3.3 实验环境第44-45页
        3.3.1 实验环境说明第44-45页
    3.4 实验结果与分析第45-56页
        3.4.1 集群规模、数据量的影响第45-46页
        3.4.2 集群稳定性测试第46-48页
        3.4.3 分布式LDA正确性验证第48-50页
        3.4.4 实验参数的影响第50-52页
        3.4.5 数据倾斜的影响第52-53页
        3.4.6 集群聚集度的影响第53-55页
        3.4.7 数据集差异的影响第55-56页
    3.5 本章小结第56-57页
第四章 Hadoop可视化管理平台第57-73页
    4.1 平台需求分析第57-58页
    4.2 总体设计架构第58页
        4.2.1 设计框架第58页
    4.3 后台关键技术和实现第58-64页
        4.3.1 后台中间数据的准备第58-59页
        4.3.2 基于RBAC的权限控制第59-61页
        4.3.3 MVC架构与应用第61-62页
        4.3.4 Servlet及其环境配置第62-64页
    4.4 界面设计与实现第64-72页
        4.4.1 应用层布局与实现第64-65页
        4.4.2 界面设计及效果第65-72页
    4.5 本章小结第72-73页
第五章 总结与展望第73-75页
    5.1 总结第73页
    5.2 展望第73-75页
参考文献第75-79页
致谢第79页

论文共79页,点击 下载论文
上一篇:含硫族邻位碳硼烷有机金属钴化合物的合成及其与炔烃的反应性研究
下一篇:以小博大:越美巴黎谈判中的越南自主外交(1968-1973)