基于Lucene的web站内英文PDF文档全文检索研究

摘要	第1-5页
Abstract	第5-8页
1 绪论	第8-12页
·课题背景及需求	第8页
·全文检索的概念	第8-9页
·全文检索引擎工具包LUCENE 简介	第9-10页
·LUCENE 的优点	第10页
·LUCENE 的特点	第10-11页
·本论文的结构以及主要工作	第11-12页
2 LUCENE 与关系型数据库的对比	第12-16页
·LUCENE 与关系型数据库概述	第12页
·LUCENE 与传统关系型数据库的联系	第12页
·两者在全文检索问题上的对比	第12-13页
·LUCENE 与数据库索引的对比	第13-14页
·LUCENE 与数据库模糊查询的对比	第14-16页
3 LUCENE 系统结构分析	第16-22页
·LUCENE 系统结构组织	第16-17页
·LUCENE 数据流分析	第17-18页
·对LUCENE 分析中学习到的先进理念	第18-19页
·基于LUCENE 的应用开发	第19-22页
4 网络爬虫模块的设计	第22-44页
·基于LUCENE 的英文PDF 文档全文检索系统框架	第22页
·网络爬虫模块的设计	第22-44页
·Config	第24-25页
·Main	第25-26页
·SerialGen	第26-27页
·ProxyUsers	第27-29页
·LinkManager	第29-31页
·Downloader	第31-32页
·Crawler	第32-35页
·run( )方法	第35-42页
·processPDF( )方法	第42-44页
5 文档分析模块的设计	第44-56页
·文档分析模块的设计目的	第44页
·文档分析模块中几个主要类的设计说明	第44-56页
·Indexer	第44-47页
·PDFAnalyzer	第47-50页
·PDFExtractor	第50-52页
·getKeyWordText(String, int)方法	第52-53页
·SimpleTextAnalyzer	第53-56页
6 用户查询模块的设计	第56-66页
·用户界面的设计	第56-57页
·用户界面模块的设计目标	第56页
·用户界面模块的设计实施	第56-57页
·用户界面模块中主要类的设计说明	第57-66页
·Main	第57页
·Config 类	第57页
·Searcher	第57-60页
·Result	第60-63页
·ImCache	第63-66页
7 运行评估以及未来展望	第66-68页
·运行评估	第66页
·安装方式	第66-67页
·未来的改进方向	第67页
·论文结论	第67-68页
致谢	第68-69页
作者攻读硕士期间的研究成果	第69页
作者攻读硕士期间参与的研究项目	第69-70页
参考文献	第70-71页