首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

基于Hadoop的专利文献存储平台的设计与实现

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第11-17页
    1.1 研究背景与意义第11-12页
    1.2 研究现状第12-14页
        1.2.1 海量专利文献数据存储现状第12-13页
        1.2.2 信息检索现状第13-14页
    1.3 论文主要工作第14-15页
    1.4 论文结构第15-16页
    1.5 本章小结第16-17页
第2章 相关技术第17-32页
    2.1 数据存储技术第17-20页
        2.1.1 海量数据云存储技术第17-19页
        2.1.2 网格存储技术第19-20页
    2.2 分布式文件系统第20-25页
        2.2.1 分布式文件存储HDFS第21-23页
        2.2.2 Map/Reduce处理模型第23页
        2.2.3 结构化数据库Hbase第23-25页
    2.3 小文件存储格式第25-26页
        2.3.1 Hadoop Archive文件归档第25-26页
        2.3.2 SequenceFile存储格式第26页
        2.3.3 CombineFileInputFormat存储格式第26页
    2.4 聚类算法第26-28页
    2.5 相似性度量方法第28-29页
    2.6 Lucene工具介绍第29-31页
    2.7 本章小结第31-32页
第3章 专利文献存储平台的方案设计第32-42页
    3.1 专利文献数据存储平台的需求分析第32-33页
    3.2 平台整体结构设计第33-35页
    3.3 基于海量数据的K-means聚类算法存储模型第35-36页
    3.4 存储方案设计第36-38页
    3.5 数据查询设计第38-39页
    3.6 数据采集设计第39-40页
    3.7 数据处理方案设计第40页
    3.8 本章小结第40-42页
第4章 基于Hadoop的专利文献存储平台实现第42-61页
    4.1 基于聚类的数据存储实现第42-53页
        4.1.1 文本量化预处理第42-47页
        4.1.2 文本聚类第47-52页
        4.1.3 聚类数据存储第52-53页
    4.2 目录存储和索引实现第53-55页
        4.2.1 基于目录的存储第53-54页
        4.2.2 二级索引实现第54-55页
    4.3 检索实现第55-60页
        4.3.1 输入预处理第55页
        4.3.2 检索优化第55-57页
        4.3.3 跨语检索实现第57-60页
    4.4 本章小结第60-61页
第5章 平台性能测试与分析第61-72页
    5.1 平台运行环境第61页
    5.2 部署Hadoop第61-62页
    5.3 测试指标第62页
    5.4 测试数据集第62-63页
    5.5 测试结果和性能分析第63-71页
    5.6 本章小结第71-72页
第6章 总结与展望第72-74页
    6.1 总结第72页
    6.2 展望第72-74页
参考文献第74-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:公交站点短时客流预测模型的研究
下一篇:公交行车计划的模型构造与应用研究