首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

企业搜索引擎关键技术研究

摘要第4-5页
ABSTRACT第5-6页
目录第7-9页
第一章 绪论第9-14页
    1.1. 课题背景和意义第9-10页
    1.2. 课题的研究现状第10-11页
    1.3. 前人工作研究成果综述第11-12页
    1.4. 本文的内容和结构第12-14页
第二章 相关研究工作综述第14-29页
    2.1. 搜索引擎相关技术第14-17页
        2.1.1. 搜索引擎工作原理第14-16页
        2.1.2. 搜索引擎分类第16-17页
    2.2. Hadoop相关技术第17-21页
        2.2.1. Hadoop框架介绍第17-18页
        2.2.2. MapReduce编程模型第18-19页
        2.2.3. HDFS分布式文件系统第19-20页
        2.2.4. Hadoop安全性与可靠性第20-21页
    2.3. 中文分词技术第21-23页
        2.3.1. 中文分词技术概要第21-22页
        2.3.2. 中文分词难点第22页
        2.3.3. 中文分词常用方法第22-23页
    2.4. Lucene相关技术第23-26页
        2.4.1. Lucene文档结构第23-25页
        2.4.2. Lucene索引相关类第25-26页
    2.5. 搜索引擎评价指标体系第26-27页
    2.6. ROBOTS协议第27-28页
    2.7. 本章小结第28-29页
第三章 面向企业网的全文检索评分算法第29-39页
    3.1. 全文检索评分算法研究第29-32页
        3.1.1. 词频位置加权评分算法第29-30页
        3.1.2. PageRank评分算法第30-32页
    3.2. 面向企业网的检索评分算法第32-38页
        3.2.1. 面向企业网的检索评分算法需求分析第32-33页
        3.2.2. 面向企业网的检索评分算法设计第33-35页
        3.2.3. 基于双字耦合度的歧义消除分词算法设计第35-38页
    3.3. 本章小结第38-39页
第四章 企业网搜索引擎系统设计与实现第39-57页
    4.1. 系统总体架构第39-40页
    4.2. 分布式爬虫模块设计与实现第40-47页
        4.2.1. 分布式爬虫模块分析第40-42页
        4.2.2. 分布式爬虫模块架构设计第42-43页
        4.2.3. 分布式爬虫模块系统实现第43-47页
    4.3. 分布式索引模块设计与实现第47-53页
        4.3.1. 分布式索引模块分析第48-49页
        4.3.2. 分布式索引模块架构设计第49页
        4.3.3. 分布式索引模块的实现第49-53页
    4.4. 分布式检索模块设计与实现第53-56页
        4.4.1. 分布式检索模块架构设计第53-55页
        4.4.2. 分布式检索模块实现第55-56页
    4.5. 本章小结第56-57页
第五章 企业网搜索引擎的实验测试与分析第57-65页
    5.1. 实验软硬件环境第57页
    5.2. 企业网搜索引擎部署配置第57-60页
        5.2.1. SSH登陆配置第57-58页
        5.2.2. Hadoop平台配置第58-60页
    5.3. 企业网搜索引擎测试与分析第60-64页
        5.3.1. 系统功能测试第60-62页
        5.3.2. 系统性能测试第62-63页
        5.3.3. 中文分词测试第63-64页
    5.4. 本章小结第64-65页
第六章 总结与展望第65-67页
    6.1. 工作总结第65-66页
    6.2. 展望第66-67页
参考文献第67-70页
致谢第70-71页
作者攻读学位期间发表的学术论文目录第71页

论文共71页,点击 下载论文
上一篇:原发性痛风不同中医证型患者外周血单个核细胞NLRP3炎性体基因转录剪接体的研究
下一篇:上海城郊不同社区2型糖尿病患者证治、代谢特点分析及糖尿病管理状况初探