首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于分布式的搜索引擎技术研究与设计

摘要第6-7页
abstract第7页
第1章 绪论第10-16页
    1.1 研究背景及意义第10-11页
        1.1.1 研究背景第10页
        1.1.2 研究意义第10-11页
    1.2 国内外研究现状第11-13页
    1.3 论文主要研究内容第13-14页
    1.4 论文结构第14-16页
第2章 相关理论技术分析第16-32页
    2.1 搜索引擎原理第16页
    2.2 分布式计算技术第16-18页
        2.2.1 分布式计算平台第16-17页
        2.2.2 Hadoop中的Map/Reduce编程模型第17-18页
        2.2.3 HDFS分布式文件系统第18页
    2.3 网络爬虫第18-20页
    2.4 分词技术第20-21页
    2.5 索引技术第21-26页
        2.5.1 索引技术介绍第21-22页
        2.5.2 倒排索引第22页
        2.5.3 基于Lucene的全文检索第22-26页
    2.6 网页评分与排序机制第26-30页
    2.7 本章小结第30-32页
第3章 分布式搜索引擎技术方案分析第32-40页
    3.1 分布式搜索引擎技术方案第32-37页
        3.1.1 分布式元搜索引擎第32-33页
        3.1.2 散列式分布搜索引擎第33-34页
        3.1.3 基于P2P的分布搜索引擎第34-36页
        3.1.4 局部遍历型搜索引擎第36-37页
    3.2 基于Hadoop的分布式搜索引擎技术方案第37-38页
    3.3 技术方案对比分析第38-39页
    3.4 本章小结第39-40页
第4章 基于Hadoop的分布式搜索引擎设计第40-68页
    4.1 系统总体设计第40页
    4.2 爬行子模块设计第40-44页
        4.2.1 初始URL注入第42-43页
        4.2.2 注入生成待下载列表第43页
        4.2.3 网页内容下载第43-44页
        4.2.4 crawldb数据库更新第44页
    4.3 索引子模块设计第44-51页
        4.3.1 非结构化文档解析第46-48页
        4.3.2 Jcesg中文分词第48-49页
        4.3.3 基于用户访问反馈的PageRank算法第49-50页
        4.3.4 索引库构建第50-51页
    4.4 检索子模块设计第51-57页
        4.4.1 前台展示第52-54页
        4.4.2 后台查询处理第54-57页
    4.5 系统评测分析第57-66页
        4.5.1 分布式环境部署第57-60页
        4.5.2 系统测试第60-66页
    4.6 本章小结第66-68页
结论第68-69页
参考文献第69-72页
攻读硕士学位期间发表的论文和取得的科研成果第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:基于智能终端的家校通云服务平台设计
下一篇:手指静脉图像质量评估方法研究