| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 1 绪论 | 第8-12页 |
| ·课题背景及需求 | 第8页 |
| ·全文检索的概念 | 第8-9页 |
| ·全文检索引擎工具包LUCENE 简介 | 第9-10页 |
| ·LUCENE 的优点 | 第10页 |
| ·LUCENE 的特点 | 第10-11页 |
| ·本论文的结构以及主要工作 | 第11-12页 |
| 2 LUCENE 与关系型数据库的对比 | 第12-16页 |
| ·LUCENE 与关系型数据库概述 | 第12页 |
| ·LUCENE 与传统关系型数据库的联系 | 第12页 |
| ·两者在全文检索问题上的对比 | 第12-13页 |
| ·LUCENE 与数据库索引的对比 | 第13-14页 |
| ·LUCENE 与数据库模糊查询的对比 | 第14-16页 |
| 3 LUCENE 系统结构分析 | 第16-22页 |
| ·LUCENE 系统结构组织 | 第16-17页 |
| ·LUCENE 数据流分析 | 第17-18页 |
| ·对LUCENE 分析中学习到的先进理念 | 第18-19页 |
| ·基于LUCENE 的应用开发 | 第19-22页 |
| 4 网络爬虫模块的设计 | 第22-44页 |
| ·基于LUCENE 的英文PDF 文档全文检索系统框架 | 第22页 |
| ·网络爬虫模块的设计 | 第22-44页 |
| ·Config | 第24-25页 |
| ·Main | 第25-26页 |
| ·SerialGen | 第26-27页 |
| ·ProxyUsers | 第27-29页 |
| ·LinkManager | 第29-31页 |
| ·Downloader | 第31-32页 |
| ·Crawler | 第32-35页 |
| ·run( )方法 | 第35-42页 |
| ·processPDF( )方法 | 第42-44页 |
| 5 文档分析模块的设计 | 第44-56页 |
| ·文档分析模块的设计目的 | 第44页 |
| ·文档分析模块中几个主要类的设计说明 | 第44-56页 |
| ·Indexer | 第44-47页 |
| ·PDFAnalyzer | 第47-50页 |
| ·PDFExtractor | 第50-52页 |
| ·getKeyWordText(String, int)方法 | 第52-53页 |
| ·SimpleTextAnalyzer | 第53-56页 |
| 6 用户查询模块的设计 | 第56-66页 |
| ·用户界面的设计 | 第56-57页 |
| ·用户界面模块的设计目标 | 第56页 |
| ·用户界面模块的设计实施 | 第56-57页 |
| ·用户界面模块中主要类的设计说明 | 第57-66页 |
| ·Main | 第57页 |
| ·Config 类 | 第57页 |
| ·Searcher | 第57-60页 |
| ·Result | 第60-63页 |
| ·ImCache | 第63-66页 |
| 7 运行评估以及未来展望 | 第66-68页 |
| ·运行评估 | 第66页 |
| ·安装方式 | 第66-67页 |
| ·未来的改进方向 | 第67页 |
| ·论文结论 | 第67-68页 |
| 致谢 | 第68-69页 |
| 作者攻读硕士期间的研究成果 | 第69页 |
| 作者攻读硕士期间参与的研究项目 | 第69-70页 |
| 参考文献 | 第70-71页 |