首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于分布式计算的搜索引擎关键技术研究与实现

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-12页
   ·研究背景第8页
   ·搜索引擎的发展第8-10页
   ·分布式搜索引擎研究现状第10页
   ·本文研究内容及章节安排第10-12页
第二章 分布式系统关键技术第12-20页
   ·分布式文件系统(DFS)第12-14页
     ·关于 DFS第12-13页
     ·Google GFS第13-14页
     ·Hadoop HDFS第14页
   ·Map/Reduce 分布式计算模型第14-16页
     ·关于 Map/Reduce第14-15页
     ·Map/Reduce 的原理及实现第15-16页
   ·分布式结构化数据存储系统第16-19页
     ·关于分布式结构化数据存储第16-17页
     ·Google Bigtable第17-18页
     ·Hadoop Hbase第18-19页
   ·本章总结第19-20页
第三章 分布式搜索引擎关键技术分析第20-30页
   ·分布式爬虫技术第20-23页
     ·网络爬虫概述第20页
     ·网络爬虫工作原理第20-22页
     ·分布式网络爬虫第22-23页
   ·中文分词技术第23-26页
     ·分词技术概述第23页
     ·基于字符串匹配的分词方法第23-24页
     ·基于统计的分词方法第24-25页
     ·基于知识理解的分词方法第25-26页
   ·倒排索引技术第26-29页
     ·索引技术概述第26页
     ·搜索引擎倒排索引原理第26-27页
     ·Map/Reduce 构建倒排索引第27-29页
   ·本章总结第29-30页
第四章 算法改进及性能优化第30-48页
   ·多线程事件异步响应模型原理及应用第30-35页
     ·多线程编程模型第30-31页
     ·多线程爬虫及模型改进第31-32页
     ·多优先级多队列应用第32-33页
     ·实验测试及结论第33-35页
   ·布隆过滤器(Bloom Filter)第35-38页
     ·Bloom Filter 工作原理第35-37页
     ·网络爬虫 Bloom Filter 应用第37-38页
   ·三叉 Trie 树第38-41页
     ·标准 Trie 树在分词算法上的应用第38-39页
     ·三叉 Trie 树第39-40页
     ·实验测试及结论第40-41页
   ·多级缓存索引及其应用第41-46页
     ·多级缓存索引技术第41-44页
     ·关键词之间相关度计算第44页
     ·缓存替换策略第44-45页
     ·实验测试及结论第45-46页
   ·本章总结第46-48页
第五章 分布式搜索引擎设计与实现第48-60页
   ·分布式搜索引擎总体设计第48-53页
     ·系统总体结构第48-49页
     ·网络爬行子系统设计第49-51页
     ·索引子系统设计第51-52页
     ·检索子系统设计第52-53页
   ·分布式搜索引擎详细设计及实现第53-59页
     ·Hadoop 分布式环境部署第53-54页
     ·网络爬行子系统实现第54-55页
     ·索引子系统实现第55-57页
     ·检索子系统实现第57-59页
   ·本章总结第59-60页
第六章 总结与展望第60-62页
   ·工作总结第60页
   ·展望第60-62页
致谢第62-64页
参考文献第64-67页

论文共67页,点击 下载论文
上一篇:基于多模态特征的视频语义镜头标注
下一篇:近似最优最近邻高维局部线性扫描算法研究