首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于LUCENE的全文搜索引擎的研究

摘要第1-3页
Abstract第3-8页
第一章 绪论第8-12页
   ·课题的来源及研究意义第8-9页
     ·课题的来源第8页
     ·研究的背景及意义第8-9页
   ·国内外搜索引擎的发展第9-10页
     ·搜索引擎的发展历程第9页
     ·搜索引擎的分类第9-10页
     ·搜索引擎的发展趋势第10页
   ·论文主要研究内容第10-11页
   ·论文组织结构第11-12页
第二章 搜索引擎与LUCENE第12-20页
   ·搜索引擎的概念及工作原理第12-13页
     ·搜索引擎的概念第12页
     ·搜索引擎的工作原理简介第12-13页
   ·搜索引擎的关键技术第13-15页
     ·采集器第14页
     ·索引器第14-15页
     ·检索器第15页
     ·用户接口第15页
   ·搜索引擎的评价指标第15页
   ·搜索引擎的开源工具包-CENE第15-19页
     ·LUCENE的概述第15-16页
     ·LUCENE的系统结构及倒排索引第16-18页
     ·LUCENE的检索机制第18-19页
   ·本章小结第19-20页
第三章 网页去重的关键技术研究第20-33页
   ·网页去重概述第20-21页
     ·网页去重的起源第20-21页
     ·网页去重的原理及目标第21页
     ·常用的几种去重方法第21页
   ·基于文本聚类的网页去重技术第21-23页
     ·网页聚类的研究现状第21-22页
     ·K-means算法分析第22-23页
   ·树结构的网页聚类第23-30页
     ·树结构的网页聚类算法简介第23-24页
     ·树结构网页聚类与网页去重第24页
     ·树结构的网页聚类算法的相关定义第24页
     ·树结构网页聚类的预处理阶段第24-25页
     ·树结构网页聚类的聚类处理阶段第25-27页
     ·树结构网页聚类的结果返回第27-28页
     ·聚类实例第28-30页
   ·实验第30-32页
     ·实验分析的评估理论第30页
     ·实验的测试结果第30-31页
     ·实验的测试结果分析第31-32页
   ·本章小结第32-33页
第四章 基于LUCENE的搜索引擎模拟系统的实现第33-48页
   ·基于LUCENE的搜索引擎体系结构第33-39页
     ·网页抓取第33-35页
     ·相似度计算第35-36页
     ·关键词抽取第36-37页
     ·网页聚类第37页
     ·网页排序第37-38页
     ·创建倒排索引第38-39页
     ·检索器第39页
   ·系统开发的组件与环境第39-40页
   ·LUCENE搜索引擎系统的实现第40-46页
     ·网络爬虫模块第40-41页
     ·索引模块第41-44页
     ·检索模块第44-46页
     ·用户界面模块第46页
   ·系统运行的效果第46-47页
   ·本章小结第47-48页
第五章 总结与展望第48-51页
   ·总结第48-50页
     ·论文研究成果第48-49页
     ·系统中遇到的困难及解决的方案第49-50页
   ·未来工作的展望第50-51页
致谢第51-52页
参考文献第52-55页
作者简介第55页
攻读硕士学位期间研究成果第55-56页

论文共56页,点击 下载论文
上一篇:基于视觉的汽车驾驶员疲劳检测技术研究
下一篇:视觉深度信息提取方法研究