首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于MapReduce的分布式聚类搜索引擎设计与实现

摘要第5-6页
Abstract第6-7页
第一章 绪论第10-16页
    1.1 研究背景及意义第10-11页
        1.1.1 研究的背景第10-11页
        1.1.2 研究的意义第11页
    1.2 国内外研究现状第11-14页
        1.2.1 搜索引擎的研究现状第11-12页
        1.2.2 分布式计算研究现状第12-14页
    1.3 本文的主要工作第14页
    1.4 论文的组织第14-16页
第二章 关键技术理论第16-24页
    2.1 搜索引擎相关技术第16-17页
    2.2 数据采集第17页
    2.3 数据预处理第17-18页
    2.4 聚类分析概述第18页
    2.5 经典聚类算法第18-23页
        2.5.1 K-means算法和其改进第19-20页
        2.5.2 Canopy-Kmeans算法和其改进第20-23页
    2.6 本章小结第23-24页
第三章 分布式聚类搜索引擎需求分析第24-29页
    3.1 系统设计原则及整体需求第24-25页
        3.1.1 设计原则第24页
        3.1.2 系统整体需求第24-25页
    3.2 详细需求分析第25-28页
        3.2.1 业务需求分析第25-26页
        3.2.2 功能需求分析第26-28页
    3.3 本章小结第28-29页
第四章 分布式聚类搜索引擎的设计第29-52页
    4.1 总体功能设计第29页
    4.2 系统技术框架设计第29-31页
    4.3 信息采集模块设计第31-34页
    4.4 信息预处理模块设计第34-37页
    4.5 分布式聚类算法设计第37-45页
        4.5.1 K-means算法步骤设计第39-41页
        4.5.2 K-means的MapReduce模式设计第41-42页
        4.5.3 Canopy算法的步骤设计第42-44页
        4.5.4 Canopy-Kmeans的MapReduce模式设计第44-45页
    4.6 搜索聚类模块设计第45-49页
    4.7 搜索结果展示模块设计第49-51页
    4.8 本章小结第51-52页
第五章 分布式聚类搜索引擎的实现第52-72页
    5.1 分布式集群环境第52-54页
    5.2 注册登录模块实现第54-58页
    5.3 信息采集模块实现第58-63页
    5.4 信息预处理模块实现第63-65页
    5.5 Canopy-Kmeans算法并行化实现第65-70页
    5.6 搜索结果展示模块实现第70-71页
    5.7 本章小结第71-72页
第六章 聚类引擎系统测试及算法测试第72-77页
    6.1 测试环境和测试数据第72页
    6.2 聚类引擎系统测试第72-74页
    6.3 聚类算法性能测试第74-76页
    6.4 本章小结第76-77页
第七章 总结与展望第77-78页
    7.1 总结第77页
    7.2 展望第77-78页
致谢第78-79页
参考文献第79-82页

论文共82页,点击 下载论文
上一篇:电力建设企业项目流程管理系统的设计与实现
下一篇:汽车软件开发可视化设计环境的研究和实现