基于LUCENE全文搜索引擎关键技术的研究

摘要	第1-5页
ABSTRACT	第5-9页
第一章:绪论	第9-14页
·网络蜘蛛的研究背景及研究现状	第9-11页
·全文检索系统的现状	第11-12页
·全文检索系统的发展趋势	第12页
·本文工作	第12-14页
第二章:全文检索系统关键技术的概述	第14-35页
·网络蜘蛛基本模型	第14-21页
·URL处理器	第14-15页
·Web信息提取器	第15页
·网页去重检测器	第15-16页
·JAVA多线程技术	第16-19页
·Web信息提取中的主要技术问题	第19-21页
·网页更新技术	第21-24页
·Quartz简介	第21页
·设计基于Quartz的定时更新程序	第21-24页
·全文检索系统的概述	第24-27页
·全文检索系统的含义和特点	第24-26页
·全文检索基本原理	第26-27页
·全文索引的组织	第27-29页
·正排表和倒排表	第27-29页
·倒排表的组织	第29页
·全文检索引擎LUCENE的研究	第29-35页
·LUCENE简介	第29-31页
·LUCENE实现机制	第31-35页
第三章:全文搜索引擎分析设计	第35-43页
·系统设计目标	第35页
·系统功能	第35页
·系统设计图	第35-37页
·功能模块设计	第37-43页
·网络蜘蛛模块	第37-38页
·页面更新模块	第38-39页
·常用文档处理模块框架	第39页
·PDF处理模块	第39-40页
·Office文档处理模块	第40-41页
·HTML处理模块	第41-43页
第四章:基于LUCENE全文检索系统的实现	第43-52页
·开发工具,开发平台	第43-45页
·网络蜘蛛模块	第45-47页
·页面更新模块	第47页
·常用文档处理模块框架	第47-48页
·PDF处理模块	第48-49页
·WORD处理模块	第49页
·EXCEL处理模块	第49页
·POWERPOINT处理模块	第49-50页
·HTML处理模块	第50页
·系统演示	第50-52页
第五章:基于LUCENE全文检索系统的测试	第52-55页
·测试环境	第52页
·多种格式文档处理框架的测试	第52-55页
·模拟实验	第52-53页
·实验结果评述	第53-55页
第六章总结与展望	第55-58页
参考文献	第58-60页