首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene垂直搜索引擎的研究与实现

摘要第1-4页
ABSTRACT第4-8页
1 绪论第8-12页
   ·研究的背景与意义第8-9页
   ·垂直搜索引擎的研究现状第9-10页
   ·本论文的主要工作第10-12页
2 面向垂直搜索引擎的技术分析第12-34页
   ·搜索引擎概述第12-14页
   ·搜索引擎的体系结构第14-15页
   ·垂直搜索引擎与通用搜索引擎的比较第15-16页
   ·垂直搜索引擎的关键技术第16-26页
     ·主题相关度的判断第16-19页
     ·中文分词技术第19-23页
     ·网页排名技术第23-26页
   ·Lucene 索引技术研究第26-33页
     ·Lucene 简介第26-27页
     ·Lucene 的结构组织第27-28页
     ·Lucene 的索引文件格式第28-31页
     ·Lucene 全文索引与数据库全文索引的比较第31-33页
   ·本章小结第33-34页
3 威客任务信息垂直搜索引擎的设计第34-49页
   ·系统的功能和目标第34页
   ·威客任务信息垂直搜索引擎总体结构设计第34-35页
   ·主题蜘蛛的设计第35-40页
     ·主题相关度的判断第35-36页
     ·种子站点的选择方案第36页
     ·URL 的搜索策略第36-40页
   ·信息提取模块的设计第40-42页
     ·利用正则表达式提取网页中的信息第40-41页
     ·利用HTML Parser 提取网页中的信息第41-42页
   ·索引和检索模块的设计第42-47页
     ·索引模块的设计方案第42-45页
     ·检索模块的设计方案第45-47页
   ·本章小结第47-49页
4 威客任务信息垂直搜索引擎的实现第49-66页
   ·主题蜘蛛的实现第49-58页
     ·主题蜘蛛的工作流程第49-50页
     ·种子站点的选择第50页
     ·页面相关度的分析第50-52页
     ·多线程的实现第52页
     ·主题蜘蛛的主要类设计第52-56页
     ·主题蜘蛛Vertical Search 功能介绍第56-58页
   ·信息提取模块的实现第58-61页
   ·对索引操作的封装第61-62页
   ·搜索界面的设计与实现第62-64页
   ·索引信息更新第64-65页
     ·种子站点的更新第64-65页
     ·索引数据的更新第65页
   ·本章小结第65-66页
5 结论第66-67页
   ·工作总结第66页
   ·研究展望第66-67页
致谢第67-68页
参考文献第68-71页
附录第71页

论文共71页,点击 下载论文
上一篇:关联规则基本技术研究
下一篇:视频加密及其在助学系统中的应用研究