首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于海量数据的文本分类算法的MapReduce实现研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第10-27页
    1.1 研究背景及意义第10页
    1.2 国内外研究现状第10-13页
        1.2.1 传统分类算法的国内外研究现状与总结第10-12页
        1.2.2 云平台上算法的国内外研究现状与总结第12-13页
    1.3 关键技术研究第13-25页
        1.3.1 分类算法第13-17页
        1.3.2 Hadoop平台第17-22页
        1.3.3 服务器虚拟化第22-25页
    1.4 研究目标及内容第25-26页
    1.5 论文组织结构第26-27页
第2章 MapReduce程序第27-34页
    2.1 MapReduce综述第27-30页
        2.1.1 MapReduce思想第27-28页
        2.1.2 MapReduce实现机制第28页
        2.1.3 Shuffle过程第28-29页
        2.1.4 MapReduce实现流程第29-30页
    2.2 MapReduce应用案例第30-33页
        2.2.1 程序运行环境第30页
        2.2.2 程序运行过程第30-32页
        2.2.3 程序运行结果第32-33页
    2.3 本章小结第33-34页
第3章 贝叶斯算法的MapReduce实现研究第34-45页
    3.1 贝叶斯算法第34-38页
        3.1.1 贝叶斯算法概述第34页
        3.1.2 贝叶斯定理第34-36页
        3.1.3 贝叶斯应用案例第36-37页
        3.1.4 贝叶斯算法的类别第37-38页
    3.2 朴素贝叶斯算法的基本步骤第38-40页
    3.3 朴素贝叶斯算法的MapReduce化第40-44页
    3.4 本章小结第44-45页
第4章 实验验证第45-60页
    4.1 实验平台硬件环境部署第45-48页
        4.1.1 硬件和软件工具第45页
        4.1.2 硬件平台搭建过程第45-47页
        4.1.3 Xen的配置和启动第47-48页
    4.2 实验平台软件环境部署第48-53页
        4.2.1 Hadoop集群搭建第48-51页
        4.2.2 Starfish介绍和安装第51页
        4.2.3 Weka介绍和安装第51-52页
        4.2.4 Hadoop集群启动第52-53页
    4.3 实验设计与结果分析第53-58页
        4.3.1 单机与Hadoop集群实验对比第53-54页
        4.3.2 Hadoop集群的加速比验证实验第54-55页
        4.3.3 延迟时间对作业执行时间影响第55-56页
        4.3.4 备份个数对作业的性能影响第56-57页
        4.3.5 内存缓冲区大小对作业的性能影响第57-58页
        4.3.6 单点故障对作业的性能影响第58页
    4.4 本章小结第58-60页
结论第60-62页
参考文献第62-66页
攻读硕士学位期间发表的论文和取得的科研成果第66-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:碰摩转子系统动力学特性及其故障分析研究
下一篇:大型风力机复合材料叶片弯扭耦合特性研究