分布式搜索引擎研究与实现
摘要 | 第1-4页 |
Abstract | 第4-7页 |
第1章 绪论 | 第7-10页 |
·研究背景 | 第7页 |
·搜索引擎现状分析 | 第7-8页 |
·选题意义 | 第8页 |
·论文贡献 | 第8-9页 |
·论文的组织结构 | 第9-10页 |
第2章 搜索引擎工作原理与排序分析 | 第10-24页 |
·搜索引擎工作流程 | 第10-11页 |
·搜索引擎体系架构 | 第11-12页 |
·搜索引擎排序分析与计算 | 第12-24页 |
·网页质量等级评价 | 第13-17页 |
·文本相似度评价 | 第17-20页 |
·图片和视频的文本相似度评价 | 第20-21页 |
·关键字的综合排序 | 第21页 |
·检索系统的查询排序 | 第21-24页 |
第3章 搜索引擎信息采集系统 | 第24-42页 |
·信息采集系统的工作原理 | 第24-28页 |
·信息采集工作流程 | 第24-25页 |
·信息采集运行模型与架构 | 第25-28页 |
·信息采集类设计与时序图 | 第28-32页 |
·信息采集系统算法描述 | 第32-42页 |
·采集源的获取 | 第32页 |
·线程采集任务初始化 | 第32页 |
·线程信息采集任务调度 | 第32-33页 |
·单线程信息采集 | 第33-35页 |
·信息清洗抽取 | 第35-37页 |
·过滤页面重链接 | 第37-38页 |
·分布式信息采集 | 第38页 |
·多线程管理控制 | 第38-39页 |
·采集性能提高机制 | 第39-42页 |
第4章 搜索引擎信息分析系统 | 第42-53页 |
·信息分析系统架构设计 | 第42-43页 |
·信息分析类设计与时序分析 | 第43-45页 |
·信息分析系统算法描述 | 第45-53页 |
·线程数据调度器逻辑描述 | 第45-46页 |
·关键字提取算法总体描述 | 第46-47页 |
·基于词库文本分割算法描述 | 第47-49页 |
·文本相似度分析流程 | 第49-50页 |
·排序索引生成规则 | 第50-53页 |
第5章 搜索引擎检索系统 | 第53-58页 |
·检索系统的系统架构设计 | 第53-54页 |
·检索系统类设计与时序图 | 第54-56页 |
·检索系统检索处理流程描述 | 第56-58页 |
第6章 搜索引擎数据存储设计 | 第58-65页 |
·存储系统数据库选择 | 第58-59页 |
·分布式数据存储设计 | 第59页 |
·数据库表结构设计 | 第59-65页 |
第7章 搜索引擎测试 | 第65-76页 |
·搜索引擎测试 | 第65-74页 |
·测试环境 | 第65页 |
·网络爬虫测试 | 第65-70页 |
·检索系统测试 | 第70-74页 |
·测试总结 | 第74-76页 |
第8章 总结 | 第76-78页 |
参考文献 | 第78-80页 |
致谢 | 第80-81页 |