首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

分布式搜索引擎研究与实现

摘要第1-4页
Abstract第4-7页
第1章 绪论第7-10页
   ·研究背景第7页
   ·搜索引擎现状分析第7-8页
   ·选题意义第8页
   ·论文贡献第8-9页
   ·论文的组织结构第9-10页
第2章 搜索引擎工作原理与排序分析第10-24页
   ·搜索引擎工作流程第10-11页
   ·搜索引擎体系架构第11-12页
   ·搜索引擎排序分析与计算第12-24页
     ·网页质量等级评价第13-17页
     ·文本相似度评价第17-20页
     ·图片和视频的文本相似度评价第20-21页
     ·关键字的综合排序第21页
     ·检索系统的查询排序第21-24页
第3章 搜索引擎信息采集系统第24-42页
   ·信息采集系统的工作原理第24-28页
     ·信息采集工作流程第24-25页
     ·信息采集运行模型与架构第25-28页
   ·信息采集类设计与时序图第28-32页
   ·信息采集系统算法描述第32-42页
     ·采集源的获取第32页
     ·线程采集任务初始化第32页
     ·线程信息采集任务调度第32-33页
     ·单线程信息采集第33-35页
     ·信息清洗抽取第35-37页
     ·过滤页面重链接第37-38页
     ·分布式信息采集第38页
     ·多线程管理控制第38-39页
     ·采集性能提高机制第39-42页
第4章 搜索引擎信息分析系统第42-53页
   ·信息分析系统架构设计第42-43页
   ·信息分析类设计与时序分析第43-45页
   ·信息分析系统算法描述第45-53页
     ·线程数据调度器逻辑描述第45-46页
     ·关键字提取算法总体描述第46-47页
     ·基于词库文本分割算法描述第47-49页
     ·文本相似度分析流程第49-50页
     ·排序索引生成规则第50-53页
第5章 搜索引擎检索系统第53-58页
   ·检索系统的系统架构设计第53-54页
   ·检索系统类设计与时序图第54-56页
   ·检索系统检索处理流程描述第56-58页
第6章 搜索引擎数据存储设计第58-65页
   ·存储系统数据库选择第58-59页
   ·分布式数据存储设计第59页
   ·数据库表结构设计第59-65页
第7章 搜索引擎测试第65-76页
   ·搜索引擎测试第65-74页
     ·测试环境第65页
     ·网络爬虫测试第65-70页
     ·检索系统测试第70-74页
   ·测试总结第74-76页
第8章 总结第76-78页
参考文献第78-80页
致谢第80-81页

论文共81页,点击 下载论文
上一篇:基于轻量级ESB的银行数据交换系统的设计与实现
下一篇:PON网络流量监测系统的设计与实现