首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎中的数据存储问题研究

第1章 绪论第1-14页
 1.1 搜索引擎简介第7-10页
  1.1.1 搜索引擎的定义第7页
  1.1.2 搜索引擎的发展第7-8页
  1.1.3 搜索引擎的分类第8-9页
  1.1.4 当前主要搜索引擎第9-10页
 1.2 研究现状第10-11页
 1.3 搜索引擎的发展动向第11-13页
 1.4 内容安排第13-14页
第2章 搜索引擎技术第14-24页
 2.1 搜索引擎的挑战第14-16页
  2.1.1 传统信息检索技术第14-15页
  2.1.2 Web信息的挑战第15-16页
 2.2 搜索引擎的体系结构第16-20页
  2.2.1 Crawler第16-18页
  2.2.2 Indexer第18-19页
  2.2.3 Searcher第19-20页
 2.3 相关技术第20-22页
  2.3.1 分布式技术第20页
  2.3.2 中文分词第20-21页
  2.3.3 网页排序第21页
  2.3.4 海量数据存储第21页
  2.3.5 压缩技术第21-22页
 2.4 实际系统研究第22-24页
  2.4.1 Google的整体结构第22-23页
  2.4.2 Google的工作过程第23-24页
第3章 搜索引擎中的存储数据第24-33页
 3.1 搜索引擎中的数据第24页
 3.2 存储实现技术第24-26页
  3.2.1 存储器模型第24-25页
  3.2.2 存储技术第25-26页
 3.3 存储方式选择第26-29页
  3.3.1 页面数据第26-27页
  3.3.2 索引数据第27-28页
  3.3.3 URI数据第28-29页
 3.4 实际系统研究第29-33页
  3.4.1 Google 中的数据存储第29-31页
  3.4.2 Lucene 中的索引数据存储第31-32页
  3.4.3 Nutch 中的页面数据存储第32-33页
第4章 数据存储系统WDB的实现第33-40页
 4.1 设计特点第33页
 4.2 体系结构第33-36页
  4.2.1 数据访问模块第35页
  4.2.2 缓冲区管理模块第35页
  4.2.3 事务管理模块第35页
  4.2.4 锁管理模块第35-36页
  4.2.5 日志管理模块第36页
  4.2.6 元数据管理模块第36页
 4.3 API接口第36-38页
  4.3.1 基本API接口层第37-38页
 4.4 性能测试第38-40页
第5章 利用WDB实现CRAWLER第40-45页
 5.1 CRAWLER的数据存储第40-41页
  5.1.1 表dmntbl_#DomainID第40页
  5.1.2 表domain_info第40页
  5.1.3 表global_info第40-41页
  5.1.4 表timestamp第41页
 5.2 WDB提供的CRAWLERAPI接口第41-42页
 5.3 数据存储服务过程第42-44页
  5.3.1 连接建立过程第42页
  5.3.2 具体请求数据格式第42-44页
 5.4 试验结果第44-45页
第6章 总结与展望第45-46页
参考文献第46-49页
致谢第49页

论文共49页,点击 下载论文
上一篇:室息新生儿血浆中肾上腺髓质素、内皮素-1水平与脑损伤关系的研究
下一篇:鸟苷产生菌的选育及其发酵条件研究