首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

聚类反馈式电网资源分布搜索引擎研究与实现

摘要第5-7页
Abstract第7-8页
第一章 绪论第12-18页
    1.1 课题研究背景与意义第12-13页
    1.2 搜索引擎简介第13-15页
        1.2.1 搜索引擎的发展与分类第13-14页
        1.2.2 搜索引擎的体系结构第14页
        1.2.3 当今搜索引擎重要的优化方向第14-15页
    1.3 搜索引擎优化技术研究现状第15-16页
        1.3.1 分布式搜索引擎的研究第15页
        1.3.2 文本聚类技术在搜索引擎中的应用第15-16页
    1.4 论文主要创新点第16-18页
第二章 搜索引擎相关技术第18-32页
    2.1 全文检索技术第18-22页
        2.1.1 反向索引技术第19-20页
        2.1.2 检索技术第20-22页
    2.2 全文检索技术的开源实现第22-26页
        2.2.1 全文检索工具包Lucene第22页
        2.2.2 全文检索服务器Solr第22-23页
        2.2.3 分布式全文检索服务器So1rCloud第23-26页
    2.3 文本聚类第26-30页
        2.3.1 聚类技术第27页
        2.3.2 K-means聚类算法第27-29页
        2.3.3 度量相似性第29-30页
    2.4 本章小结第30-32页
第三章 搜索引擎建模及聚类反馈的算法改进第32-46页
    3.1 索引及搜索建模第32-35页
        3.1.1 基于电力行业词库中文分词的实现第32-33页
        3.1.2 企业文档索引库的建立第33-34页
        3.1.3 搜索索引库第34-35页
    3.2 基于K-means的聚类反馈算法改进第35-38页
        3.2.1 基于最远距离的初始聚类中心选择方法第36-37页
        3.2.2 初始参数K的确定第37-38页
    3.3 改进K-means算法的文本聚类性能测试第38-44页
        3.3.1 文本内容预处理设计第39-41页
        3.3.2 实验文本集第41页
        3.3.3 聚类实验分析第41-44页
    3.4 标识聚类关键词的提取第44页
    3.5 本章小结第44-46页
第四章 电网资源库搜索引擎设计第46-52页
    4.1 电网资源库搜索引擎架构第46-47页
    4.2 分布式搜索引擎服务器设计第47-50页
        4.2.1 Solr处理单元的设计第47-48页
        4.2.2 分布式协调子系统设计第48-49页
        4.2.3 SolrCloud服务器集群结构设计第49-50页
    4.3 负载均衡设计第50页
    4.4 检索结果的聚类分析第50-51页
    4.5 本章小结第51-52页
第五章 电网资源库分布式搜索引擎的部署与性能测试第52-64页
    5.1 部署电网资源库搜索引擎第52-53页
        5.1.1 ZooKeeper部署第52页
        5.1.2 SolrCloud部署第52-53页
        5.1.3 搜索引擎业务逻辑服务器部署第53页
    5.2 搜索引擎索引和检索性能测试第53-59页
        5.2.1 测试环境第54页
        5.2.2 测试系统的结构第54-55页
        5.2.3 索引性能测试第55-57页
        5.2.4 搜索性能测试第57-59页
    5.3 搜索引擎检索实例第59-60页
    5.4 分类显示搜索结果第60-62页
    5.5 本章小结第62-64页
第六章 工作总结与展望第64-66页
    6.1 工作总结第64页
    6.2 工作展望第64-66页
致谢第66-68页
参考文献第68-72页
附录A:攻读硕士学位期间参与项目及科研成果第72页

论文共72页,点击 下载论文
上一篇:IOS平台下基于WAPPUSH的移动学习系统建构研究与实践
下一篇:封闭立方体分布式存储与构造算法研究与实现