首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop和SVM算法的中文文本分类的研究与实现

摘要第5-6页
Abstract第6页
第一章 绪论第10-14页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-13页
        1.2.1 文本分类的研究现状第11-12页
        1.2.2 Hadoop研究现状第12-13页
    1.3 本论文的主要工作第13页
    1.4 本文的组织结构第13-14页
第二章 云计算与Hadoop平台第14-26页
    2.1 Hadoop平台第14-15页
    2.2 HDFS的工作原理第15-20页
        2.2.1 数据块第16页
        2.2.2 名称节点和数据节点第16-18页
        2.2.3 文件读写第18-20页
    2.3 MapReduce的工作机制第20-24页
        2.3.1 MapReduce的系统架构第21页
        2.3.2 MapReduce的计算流程第21-24页
    2.4 本章小结第24-26页
第三章 文本分类与支持向量机研究第26-36页
    3.1 文本分类概述第26-27页
    3.2 文本分类原理第27-30页
        3.2.1 文本预处理第27-28页
        3.2.2 文本特征选择第28-29页
        3.2.3 文本向量空间模型第29-30页
    3.3 支持向量机第30-35页
        3.3.1 支持向量机概述第30-31页
        3.3.2 支持向量机原理第31-34页
        3.3.3 支持向量机的多分类问题第34-35页
    3.4 本章小结第35-36页
第四章 并行中文文本分类的实现第36-46页
    4.1 并行化算法的设计思想第36页
    4.2 分布式预处理第36-40页
        4.2.1 预处理流程第36-39页
        4.2.2 预处理的MapReduce实现第39-40页
    4.3 特征选择第40-42页
        4.3.1 特征选择算法实现第40-41页
        4.3.2 权值计算第41-42页
    4.4 SVM算法实现第42-45页
        4.4.1 单机SVM第42-43页
        4.4.2 并行SVM第43-45页
    4.5 本章小结第45-46页
第五章 实验结果与分析第46-58页
    5.1 实验准备第46-52页
        5.1.1 Hadoop平台的搭建第46-52页
        5.1.2 实验数据第52页
    5.2 实验方案第52-53页
        5.2.1 实验设计第52-53页
        5.2.2 实验步骤第53页
    5.3 实验结果与分析第53-57页
    5.4 本章小结第57-58页
第六章 总结与展望第58-60页
    6.1 总结第58页
    6.2 展望第58-60页
致谢第60-62页
参考文献第62-66页
附录 (攻读硕士期间的学术成果)第66页

论文共66页,点击 下载论文
上一篇:领域实体属性关系抽取方法研究
下一篇:视频会议录播系统的设计与实现