首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的web站内英文PDF文档全文检索研究

摘要第1-5页
Abstract第5-8页
1 绪论第8-12页
   ·课题背景及需求第8页
   ·全文检索的概念第8-9页
   ·全文检索引擎工具包LUCENE 简介第9-10页
   ·LUCENE 的优点第10页
   ·LUCENE 的特点第10-11页
   ·本论文的结构以及主要工作第11-12页
2 LUCENE 与关系型数据库的对比第12-16页
   ·LUCENE 与关系型数据库概述第12页
   ·LUCENE 与传统关系型数据库的联系第12页
   ·两者在全文检索问题上的对比第12-13页
   ·LUCENE 与数据库索引的对比第13-14页
   ·LUCENE 与数据库模糊查询的对比第14-16页
3 LUCENE 系统结构分析第16-22页
   ·LUCENE 系统结构组织第16-17页
   ·LUCENE 数据流分析第17-18页
   ·对LUCENE 分析中学习到的先进理念第18-19页
   ·基于LUCENE 的应用开发第19-22页
4 网络爬虫模块的设计第22-44页
   ·基于LUCENE 的英文PDF 文档全文检索系统框架第22页
   ·网络爬虫模块的设计第22-44页
     ·Config第24-25页
     ·Main第25-26页
     ·SerialGen第26-27页
     ·ProxyUsers第27-29页
     ·LinkManager第29-31页
     ·Downloader第31-32页
     ·Crawler第32-35页
     ·run( )方法第35-42页
     ·processPDF( )方法第42-44页
5 文档分析模块的设计第44-56页
   ·文档分析模块的设计目的第44页
   ·文档分析模块中几个主要类的设计说明第44-56页
     ·Indexer第44-47页
     ·PDFAnalyzer第47-50页
     ·PDFExtractor第50-52页
     ·getKeyWordText(String, int)方法第52-53页
     ·SimpleTextAnalyzer第53-56页
6 用户查询模块的设计第56-66页
   ·用户界面的设计第56-57页
     ·用户界面模块的设计目标第56页
     ·用户界面模块的设计实施第56-57页
   ·用户界面模块中主要类的设计说明第57-66页
     ·Main第57页
     ·Config 类第57页
     ·Searcher第57-60页
     ·Result第60-63页
     ·ImCache第63-66页
7 运行评估以及未来展望第66-68页
   ·运行评估第66页
   ·安装方式第66-67页
   ·未来的改进方向第67页
   ·论文结论第67-68页
致谢第68-69页
作者攻读硕士期间的研究成果第69页
作者攻读硕士期间参与的研究项目第69-70页
参考文献第70-71页

论文共71页,点击 下载论文
上一篇:对影响我国竞技体育均衡发展相关因素的研究
下一篇:基于自适应提升小波的过程数据的压缩研究