首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Hadoop的电子文件分类系统的设计与实现

摘要第5-6页
Abstract第6页
第一章 绪论第9-14页
    1.1 研究背景第9-10页
    1.2 国内外研究现状第10-11页
    1.3 研究目标与主要研究内容第11-12页
    1.4 论文组织结构第12-14页
第二章 相关技术概述第14-19页
    2.1 Hadoop平台第14-16页
        2.1.1 HDFS简介第14-16页
        2.1.2 Map-Reduce简介第16页
    2.2 文本分类器第16-17页
    2.3 Solr搜索应用服务器第17-18页
    2.4 本章小结第18-19页
第三章 电子文件分类系统的需求分析与概要设计第19-31页
    3.1 系统需求分析第19-23页
        3.1.1 文件分类需求分析第20-22页
        3.1.2 文件搜索需求分析第22-23页
        3.1.3 文件预览需求分析第23页
    3.2 分类算法的分析与比较第23-26页
        3.2.1 K-邻近算法第24页
        3.2.2 支持向量机算法第24-25页
        3.2.3 朴素贝叶斯分类算法第25-26页
        3.2.4 分类算法的选择第26页
    3.3 系统总体架构设计第26-29页
        3.3.1 系统物理架构第27-28页
        3.3.2 系统软件架构第28页
        3.3.3 模块设计第28-29页
    3.4 本章小结第29-31页
第四章 电子文件分类系统的详细设计与实现第31-51页
    4.1 公共模块的设计与实现第31-34页
        4.1.1 文件读写第31-32页
        4.1.2 文件内容提取第32-33页
        4.1.3 分词及去停用词第33-34页
    4.2 文件分类模块的设计与实现第34-41页
        4.2.1 生成特征向量第35-37页
        4.2.2 构造分类器第37-39页
        4.2.3 未标记文件分类过程第39-41页
    4.3 文件搜索模块的设计与实现第41-44页
        4.3.1 维护索引第41-43页
        4.3.2 检索文件第43-44页
    4.4 文件预览模块的设计与实现第44-46页
        4.4.1 生成预览文件第44-45页
        4.4.2 展示预览文件第45-46页
    4.5 其他关键部分的设计与实现第46-50页
    4.6 本章小结第50-51页
第五章 电子文件分类系统的测试第51-61页
    5.1 测试环境第51页
    5.2 公共模块测试第51-53页
    5.3 文件分类模块测试第53-55页
        5.3.1 分类模块功能测试第53-54页
        5.3.2 分类模块性能测试第54-55页
    5.4 文件搜索模块测试第55-58页
        5.4.1 搜索模块功能测试第55-57页
        5.4.2 搜索模块性能测试第57-58页
    5.5 文件预览模块测试第58-60页
        5.5.1 预览模块功能测试第58-60页
        5.5.2 预览模块性能测试第60页
    5.6 本章小结第60-61页
第六章 总结与展望第61-62页
    6.1 本文工作总结第61页
    6.2 今后工作展望第61-62页
参考文献第62-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:全向蠕动分拣平台的执行系统设计
下一篇:2U游戏服务器的散热研究