首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene和Heritrix的主题搜索引擎的设计与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 引言第9-13页
   ·课题背景第9页
   ·选题意义第9-10页
   ·论文的主要研究工作第10-11页
   ·论文的内容结构第11-13页
第二章 主要方法和技术第13-27页
   ·综合搜索引擎的介绍和探究第13-16页
     ·综合搜索引擎的诞生及发展第13-14页
     ·综合搜索引擎的基本组成及原理第14-16页
   ·主题搜索的介绍和探究第16-21页
     ·主题搜索引擎的产生及原理第16-18页
     ·主题搜索引擎和综合搜索引擎的异同点第18-19页
     ·主题搜索引擎在国内外的发展现状第19-21页
   ·对全文检索引擎工具包LUCENE简单介绍和应用优势分析第21-24页
     ·对全文检索工具包Lucene的简单介绍第21-22页
     ·全文检索工具包Lucene框架组成及应用优势第22-24页
   ·对网络爬虫工具HERITRIX简单介绍和应用优势分析第24-27页
     ·对网络爬虫工具Heritrix的简单介绍第24-25页
     ·网络爬虫工具Heritrix的应用优势第25-27页
第三章 需求分析第27-32页
   ·主题搜索引擎的需求背景第27-28页
     ·辽大在校专任教师的需求调研第27页
     ·辽大行政管理人员和其他工作人员的需求调研第27页
     ·辽大在校学生以及关心辽大的社会人士的需求调研第27-28页
   ·主题搜索引擎的功能性需求和非功能性需求第28-29页
     ·主题搜索引擎的功能性需求第28页
     ·主题搜索引擎的非功能性需求第28-29页
   ·辽大网主题搜索引擎的必要性论证第29-30页
   ·辽大网主题搜索引擎的实现目标第30页
   ·系统软硬件需求第30-32页
第四章 主题搜索引擎的设计与实现第32-56页
   ·主题搜索引擎的总体设计第32-34页
   ·基于HERITRIX爬行抓取部分的设计与实现第34-47页
   ·基于HERITRIX技术的数据库部分设计与实现第47-50页
     ·数据库结构部分的设计与实现第47-49页
     ·存储功能部分的设计与实现第49-50页
   ·基于LUCENE的排序和索引部分设计与实现第50-56页
第五章 主题搜索引擎的测试与总结第56-61页
   ·测试部分第56-59页
   ·总结与展望第59-61页
     ·完成工作的总结第59-60页
     ·对存在不足的改进展望第60-61页
参考文献第61-62页
致谢第62-63页
攻读学位期间发表的学术论文第63-64页
附录第64-71页

论文共71页,点击 下载论文
上一篇:天津地铁2号线自动售检票系统票卡处理单元的设计与测试
下一篇:包头联通经营分析与管理系统的实现