首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的并行贝叶斯分类算法及工具研究

摘要第4-5页
Abstract第5页
第一章 绪论第12-19页
    1.1 引言第12页
    1.2 云计算及并行计算技术第12-15页
    1.3 朴素贝叶斯算法应用于文本分类任务第15-16页
    1.4 数据挖掘工具第16-17页
    1.5 本文的主要内容及意义第17-18页
    1.6 本文组织第18-19页
第二章 云计算技术第19-31页
    2.1 Hadoop的起源及其发展过程第19-20页
    2.2 HDFS分布式文件系统第20-23页
        2.2.1 HDFS的愿景和目标第20页
        2.2.2 HDFS的系统架构第20-22页
        2.2.3 HDFS系统的高容错性第22-23页
    2.3 MapReduce分布式编程模型第23-26页
        2.3.1 MapReduce编程模型概述第23页
        2.3.2 编程模型的架构第23-25页
        2.3.3 Hadoop的MapReduce编程模型的特点第25-26页
    2.4 两个基于Hadoop的分布式应用第26-30页
        2.4.1 HBase简介第26-28页
        2.4.2 Hive项目第28-30页
    2.5 本章小结第30-31页
第三章 一种并行化的半监督朴素贝叶斯分类算法第31-49页
    3.1 贝叶斯学习与朴素贝叶斯分类器第31-33页
    3.2 两种基于半监督学习的朴素贝叶斯算法第33-36页
        3.2.1 基于EM的半监督朴素贝叶斯文档分类算法第33-35页
        3.2.2 一种不基于EM的半监督朴素贝叶斯分类算法第35-36页
    3.3 并行化的半监督朴素贝叶斯算法——PSNB第36-40页
        3.3.1 PSNB-算法总体框架第36页
        3.3.2 PSNB-MR训练阶段算法描述第36-38页
        3.3.3 PSNB-构造分类器及预测阶段描述第38-40页
    3.4 实验设计与运行过程第40-45页
        3.4.1 实验环境第40页
        3.4.2 选用的数据集及其格式第40-42页
        3.4.3 实验运行过程第42-45页
    3.5 算法运行结果及其分析第45-48页
        3.5.1 准确度比较第45-46页
        3.5.2 训练时间分析第46-48页
    3.6 本章小结第48-49页
第四章 面向海量数据的数据挖掘工具的设计与开发第49-70页
    4.1 Dodo工具箱的需求分析与目标第49-51页
        4.1.1 从传统数据挖掘工具到Dodo工具箱第49页
        4.1.2 Dodo工具箱的需求分析第49-50页
        4.1.3 Dodo工具箱的目标第50-51页
    4.2 在Dodo工具箱中应用PSNB算法第51-54页
        4.2.1 启动/置Hadoop第51-52页
        4.2.2 上传数据集第52-53页
        4.2.3 选择PSNB算法/置参数第53页
        4.2.4 提交任务/取结果第53-54页
    4.3 Dodo工具箱的总体架构与设计细节第54-63页
        4.3.1 Dodo工具箱的总体架构第54-55页
        4.3.2 集群控制模块第55-58页
        4.3.3 数据集管理模块第58-61页
        4.3.4 算法管理模块第61页
        4.3.5 任务管理及可视化模块第61-63页
    4.4 Dodo工具箱所应用的关键技术及创新点第63-69页
        4.4.1 为Hadoop系统提供图形化界面第63-64页
        4.4.2 为大数据建立元数据管理系统第64-66页
        4.4.3 将常用的数据挖掘算法并行化第66-68页
        4.4.4 应用MVC编程架构来开发软件第68-69页
    4.5 本章小结第69-70页
第五章 总结与展望第70-72页
    5.1 总结第70-71页
    5.2 展望第71-72页
参考文献第72-75页
攻读硕士学位期间完成的学术成果第75页
攻读硕士学位期间参与的科研课题第75-76页
致谢第76-77页

论文共77页,点击 下载论文
上一篇:高速公路多源交通数据融合方法研究及系统开发
下一篇:基于iOS的“海边直播”客户端设计与实现