首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于MapReduce的大数据文本分类方法研究

摘要第3-5页
ABSTRACT第5-6页
1 绪论第10-14页
    1.1 研究背景第10-11页
    1.2 研究意义第11页
    1.3 国内外研究现状第11-13页
        1.3.1 文本分类研究现状第11-12页
        1.3.2 MapReduce研究现状第12-13页
    1.4 论文组织结构第13-14页
2 文本分类及MapReduce技术第14-29页
    2.1 文本分类关键技术第14-19页
        2.1.1 文本分类概述第14页
        2.1.2 文本预处理第14-16页
        2.1.3 文本特征降维第16-17页
        2.1.4 文本分类模型第17-18页
        2.1.5 评价指标第18-19页
    2.2 MapReduce编程模型第19-24页
        2.2.1 MapReduce概述第19-20页
        2.2.2 MapReduce的基本设计思想第20页
        2.2.3 MapReduce的主要功能第20-21页
        2.2.4 MapReduce的并行编程模型第21-22页
        2.2.5 MapReduce的作业调度过程和方法第22-24页
    2.3 Hadoop系统构架和MapReduce程序执行过程第24-28页
        2.3.1 Hadoop系统构架第24-25页
        2.3.2 MapReduce程序执行过程第25页
        2.3.3 HDFS基本组成结构与文件访问过程第25-27页
        2.3.4 HDFS可靠性第27-28页
    2.4 本章小结第28-29页
3 基于MapReduce的中文分词及特征选择方法第29-39页
    3.1 中文分词第29-33页
        3.1.1 IK分词器第29-30页
        3.1.2 基于MapReduce的并行化分词的设计第30-33页
    3.2 特征选择第33-38页
        3.2.1 传统的互信息选择方法第33页
        3.2.2互信息特征选择的不足第33-34页
        3.2.3 基于类间差异的特征选择方法第34-35页
        3.2.4 基于MapReduce的CDMT特征选择第35-38页
    3.3 本章小结第38-39页
4 基于MapReduce的贝叶斯文本分类器第39-51页
    4.1 朴素贝叶斯分类器第39-41页
        4.1.1 贝叶斯定理第39-40页
        4.1.2 朴素贝叶斯分类算法第40-41页
    4.2 基于MapReduce的朴素贝叶斯分类器的并行化设计第41-44页
        4.2.1 训练阶段及相关参数计算第41-42页
        4.2.2 分类阶段第42-44页
    4.3 Hadoop系统环境的搭建第44-46页
    4.4 实验和实验结果第46-50页
        4.4.1 实验设计第46-49页
        4.4.2 实验结果第49-50页
    4.5 本章小结第50-51页
5 总结与展望第51-52页
    5.1 全文总结第51页
    5.2 未来展望第51-52页
参考文献第52-56页
致谢第56-57页
攻读学位期间取得的研究成果第57-59页
浙江师范大学学位论文诚信承诺书第59页

论文共59页,点击 下载论文
上一篇:支持4k分辨率的多格式视频处理系统设计与实现
下一篇:基于FPGA的DDR3控制器IP设计与验证