首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于分布式计算的全文检索关键技术研究

摘要第4-5页
ABSTRACT第5-6页
目录第7-9页
第一章 绪论第9-16页
    1.1 研究背景及意义第9-11页
        1.1.1 研究背景第9-10页
        1.1.2 分布式全文检索课题研究意义第10-11页
    1.2 国内外研究现状第11-14页
    1.3 论文的主要研究内容第14-15页
    1.4 论文的组织结构第15-16页
第二章 相关理论基础第16-26页
    2.1 全文检索技术第16-18页
        2.1.1 文本预处理第16-17页
        2.1.2 倒排索引模型第17-18页
    2.2 分布式计算技术第18-23页
        2.2.2 分布式文件系统HDFS第19-20页
        2.2.3 分布式计算模型MapReduce第20-23页
    2.3 文本聚类介绍第23-25页
        2.3.1 文本聚类概述第23页
        2.3.2 主要的文本聚类算法第23-25页
    2.4 本章小结第25-26页
第三章 文本聚类下的分布式索引建立第26-41页
    3.1 分布式环境下的全文索引的划分组织第26-28页
        3.1.1 基于词表的索引划分组织方式第26-27页
        3.1.2 基于文档的索引划分组织方式第27-28页
    3.2 基于聚类方法的索引划分组织第28-32页
        3.2.1 文本特征向量表示第29-30页
        3.2.2 文本聚类下的索引划分组织方式第30-32页
    3.3 基于MapReduce的分布式索引建立第32-40页
        3.3.1 Lucene全文索引机制第33页
        3.3.2 MapReduce下并行索引构建方法第33-37页
        3.3.3 MapReduce下Lucene并行索引构建实现第37-40页
    3.4 本章小结第40-41页
第四章 基于词语相似度的分布式全文检索第41-50页
    4.1 分布式全文检索流程第41-42页
    4.2 分布式检索中索引集合选择第42-44页
    4.3 基词语相似度的索引集合选择算法第44-49页
        4.3.1 词语相似度及其计算方法第44页
        4.3.2 利用《知网》进行词语相似度计算第44-46页
        4.3.3 基于词语相似度的索引集合选择算法设计第46-49页
    4.4 本章小结第49-50页
第五章 实验及其分析第50-60页
    5.1 实验设计第50页
    5.2 实验环境与数据集第50-53页
        5.2.1 实验硬件与软件配置第50-51页
        5.2.2 Hadoop分布式平台搭建第51-52页
        5.2.3 实验数据集介绍第52-53页
    5.3 分布式全文索引构建第53-56页
        5.3.1 单机环境下集中式索引的构建效率第53-54页
        5.3.2 分布式集群并行索引的构建效率第54-56页
        5.3.3 分布式集群并行索引建立的性能分析第56页
    5.4 词语相似度计算下的聚类集合选择结果分析第56-59页
        5.4.1 实验评测指标第56-57页
        5.4.2 集合选择算法性能结果与分析第57-59页
    5.5 本章小结第59-60页
第六章 总结与展望第60-63页
    6.1 本文工作总结第60-61页
    6.2 未来展望第61-63页
参考文献第63-66页
致谢第66-67页
攻读硕士学位期间参与的科研项目第67页

论文共67页,点击 下载论文
上一篇:Al2O3陶瓷的自身晶须连接及其与TC4钛合金的钎焊研究
下一篇:电火花沉积WC-12Co涂层界面研究及温度场应力场模拟