首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎系统的研究

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-13页
   ·论文的研究背景第9-10页
   ·国内外研究现状第10-11页
   ·论文的相关工作第11-12页
   ·论文的组织结构第12-13页
第2章 垂直搜索引擎设计第13-18页
   ·垂直搜索引擎分析第13页
   ·垂直搜索引擎框架设计第13-15页
   ·相关开源技术介绍第15-16页
     ·Heritrix简介第15页
     ·Lucene简介第15-16页
   ·垂直搜索引擎的评估第16-17页
   ·系统软硬件开发环境第17页
   ·本章小结第17-18页
第3章 网页抓取模块第18-30页
   ·网页抓取模块的抓取策略第18-19页
   ·网页抓取模块的工作流程第19页
   ·Hertrix的关键组件第19-23页
     ·链接制造工厂Frontier第20页
     ·用Berkeley DB实现的BdbFrontier第20-22页
     ·处理器链和处理器第22-23页
   ·由Heritrix实现的个性化抓取第23-29页
     ·选择权威的IT产品网站第23页
     ·确定种子抓取清单第23-26页
     ·Heritrix的扩展第26-27页
     ·启动抓取任务第27-29页
   ·本章小结第29-30页
第4章 网页预处理与索引模块第30-52页
   ·分词技术第30-31页
     ·英文分词第30页
     ·中文分词第30-31页
   ·网页的预处理第31-32页
   ·倒排索引第32-36页
     ·倒排索引的创建第33-35页
     ·倒排索引的压缩第35-36页
   ·由Lucene建立索引第36-42页
     ·Lucene中的Document和Field第36-39页
     ·Lucene索引操作的有关类第39-42页
   ·Lucene分词第42-44页
     ·Lucene的分析器的结构和实现第42-43页
     ·Lucene的标准分析器第43-44页
     ·JE分词第44页
   ·提取网页正文信息第44-46页
   ·构建笔记本电脑产品信息词库第46-48页
   ·数据库与索引结构第48-49页
   ·数据库处理和索引处理第49-51页
   ·本章小结第51-52页
第5章 用户检索模块第52-65页
   ·相关度排序技术第52-56页
     ·向量空间模型第52-54页
     ·链接分析技术第54-56页
   ·Lucene中的检索工具包第56页
   ·Lucene的评分机制第56-57页
   ·Lucene的Query对象第57-60页
   ·多Field检索与多索引检索第60-61页
   ·检索过滤器第61页
   ·笔记本电脑垂直搜索引擎系统的检索结果第61-64页
   ·本章小结第64-65页
第6章 总结与展望第65-67页
   ·工作总结第65-66页
   ·展望第66-67页
致谢第67-68页
参考文献第68-71页
攻读硕士学位期间发表的学术论文第71页

论文共71页,点击 下载论文
上一篇:数字水印技术在移动办公中的研究与应用
下一篇:移动数据广播索引技术研究与实现