首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的全文信息检索技术的研究与应用

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-10页
   ·研究背景第7页
   ·研究现状第7-9页
     ·全文信息检索技术现状第7-8页
     ·中文分词技术现状第8-9页
   ·论文主要工作及组织结构第9-10页
     ·论文主要工作第9页
     ·论文组织结构第9-10页
第二章 Lucene技术分析第10-21页
   ·Lucene 简介第10页
   ·Lucene 框架结构分析第10-12页
     ·Lucene 框架结构第10-11页
     ·Lucene 包组织结构第11-12页
   ·Lucene 索引技术分析第12-16页
     ·Lucene 索引文件结构第12-13页
     ·Lucene 索引文件格式第13-15页
     ·Lucene 索引建立过程第15-16页
     ·Lucene 索引文件存储第16页
   ·Lucene 搜索技术分析第16页
   ·Lucene 评分机制分析第16-19页
     ·Lucene 评分公式第17页
     ·Lucene 评分公式推导第17-19页
     ·Lucene 评分排序特点第19页
   ·Lucene 分词器分析第19-20页
     ·Lucene 分词器的组成第19页
     ·常用中文分词器分析第19-20页
   ·本章小结第20-21页
第三章 网页采集和提取技术的分析与改进第21-33页
   ·网络爬虫第21-22页
     ·工作原理第21页
     ·组成部分第21-22页
     ·工作流程第22页
   ·网络爬虫Heritrix 分析第22-29页
     ·Heritrix 框架结构分析第23-24页
     ·Crawl Controller 中央控制器第24-25页
     ·在MyEclipse 环境下配置Heritrix第25-26页
     ·对Heritrix 的改进工作第26-29页
   ·网页解析工具分析第29-32页
     ·HTML 网页结构第29-30页
     ·HTML Parser 分析第30-32页
   ·本章小结第32-33页
第四章 中文分词算法改进和设计第33-48页
   ·中文分词算法分析第33-35页
     ·四种中文分词算法简介第33-35页
     ·四种中文分词算法比较第35页
   ·三级索引词典结构设计与分词算法的改进第35-42页
     ·经典词典结构第35-37页
     ·三级索引词典结构第37-38页
     ·词典结构的存储第38页
     ·查找词典词条算法第38-39页
     ·分词算法的改进第39-40页
     ·分词算法时间复杂度和实验比较分析第40-42页
   ·中文分词器的实现第42-47页
     ·分词器的实现第42-44页
     ·实验比较分析第44-47页
   ·本章小结第47-48页
第五章 基于Lucene全文信息检索系统设计与实现第48-57页
   ·开发运行环境第48页
   ·Struts 框架技术的应用第48-49页
   ·系统总体架构第49-50页
   ·系统主要功能实现第50-55页
     ·网页抓取模块第50-51页
     ·索引模块第51-53页
     ·检索模块第53-54页
     ·其他功能模块第54-55页
   ·搜索引擎模型系统的运行演示第55-56页
   ·本章小结第56-57页
第六章 总结与展望第57-58页
   ·总结第57页
   ·展望第57-58页
致谢第58-59页
参考文献第59-62页
附录:作者在攻读硕士学位期间发表的论文第62页

论文共62页,点击 下载论文
上一篇:人脸识别方法及其应用研究
下一篇:射频识别(RFID)技术中防碰撞算法的研究