首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

小文本语料库在Hadoop平台上的存储策略研究

摘要第5-6页
Abstract第6-7页
第一章 引言第10-15页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-12页
    1.3 主要研究内容第12-13页
    1.4 论文组织结构第13-15页
第二章 相关平台及技术第15-25页
    2.1 Hadoop平台简介第15-19页
        2.1.1 HDFS分布式文件系统第16-17页
        2.1.2 MapReduce并行计算模型第17-19页
    2.2 小文本直接存储Hadoop的劣势与解决方法第19-23页
        2.2.1 小文本直接存储Hadoop的劣势第20页
        2.2.2 Hadoop提供的解决方法第20-23页
    2.3 虚拟存储技术第23-24页
    2.4 本章小结第24-25页
第三章 HSCS存储策略的分析与设计第25-37页
    3.1 存储策略的设计思路第25页
    3.2 存储策略的主要技术第25-26页
    3.3 HSCS技术的分析与设计第26-29页
        3.3.1 小文本合并技术的分析与设计第26-27页
        3.3.2 小文本检索技术的分析与设计第27-29页
    3.4 存储策略算法设计第29-35页
        3.4.1 相关类的介绍第29-31页
        3.4.2 合并算法设计第31-33页
        3.4.3 检索算法设计第33-35页
    3.5 存储策略可行性研究第35-36页
    3.6 本章小结第36-37页
第四章 HSCS存储策略的实现第37-46页
    4.1 小文本存储的预处理第37-41页
        4.1.1 中文分词与去停用词第37-38页
        4.1.2 特征选择第38-40页
        4.1.3 小文本存储预处理第40-41页
    4.2 小文本合并的实现第41-43页
    4.3 小文本索引的实现第43-45页
    4.4 本章小结第45-46页
第五章 实验与数据分析第46-53页
    5.1 实验目的第46页
    5.2 实验环境第46-48页
        5.2.1 配置信息第46-47页
        5.2.2 Hadoop实验平台的搭建第47-48页
        5.2.3 配置文件的重启与代码的编译第48页
    5.3 实验方案与结果分析第48-52页
        5.3.1 合并前后写入HDFS速度实验第49-50页
        5.3.2 合并前后预处理速度实验第50-51页
        5.3.3 随机检索实验第51-52页
    5.4 本章小结第52-53页
第六章 总结与展望第53-55页
参考文献第55-58页
在校期间发表的论文、科研成果等第58-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:Android智能手机上彩色图像的版权保护
下一篇:保险行业客户管理系统的设计与实现