首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于LUCENE的主题搜索引擎研究与实现

摘要第1-5页
ABSTRACT第5-10页
1 绪论第10-13页
   ·引言第10页
   ·选题背景第10-11页
   ·选题意义第11-12页
   ·论文的主要研究工作第12页
   ·论文的内容结构第12-13页
2 搜索引擎基本知识第13-22页
   ·搜索引擎发展的历史过程第13-16页
   ·通用搜索引擎面临的问题第16-17页
   ·主题搜索引擎的产生第17页
   ·主题搜索引擎与综合搜索引擎的异同点第17-20页
     ·主题搜索引擎和综合搜索引擎在信息服务上的异同第17-18页
     ·主题搜索引擎和综合搜索引擎在关键技术上的异同第18-20页
   ·主题搜索引擎国内外研究现状第20-22页
     ·国外研究现状第20页
     ·国内研究现状第20-22页
3 主题搜索引擎爬取技术解析第22-32页
   ·爬虫抓取的基本策略第22-23页
   ·WEB 爬行原理第23-25页
     ·Web 爬取器的结构第23-24页
     ·Web 爬取策略第24-25页
   ·搜索引擎经典算法第25-32页
     ·PageRank 算法和Hits 算法第25-28页
     ·基于页面内容的算法第28页
     ·Shark 算法及其改进第28-32页
4 全文检索框架LUCENE 剖析第32-48页
   ·全文检索包LUCENE 的概述第32-36页
     ·全文检索与全文检索系统第32-33页
     ·Lucene 项目简介第33-34页
     ·Lucene 框架组成第34-36页
   ·LUCENE 索引技术第36-40页
     ·倒排文件第36-38页
     ·Lucene 索引的数据结构第38-40页
   ·LUCENE 检索技术第40-48页
     ·文档与词条向量空间第40页
     ·tf-idf 加权策略第40-41页
     ·Lucene 的文档得分算法第41-42页
     ·Lucene 的排序策略第42-48页
5 一个主题搜索引擎的实现第48-76页
   ·项目总体系统设计第48-49页
   ·信息采集子系统的设计与实现第49-63页
     ·Heritrix 的介绍第49-50页
     ·选取Heritrix 框架的原因第50-51页
     ·基于Heritrix 框架的采集信息的实现第51-56页
     ·手机网页信息的处理第56-63页
   ·索引子系统的设计与实现第63-69页
     ·产品信息词库的构建第63-66页
     ·建立产品详细信息数据库和索引结构第66-67页
     ·对索引进行操作第67-69页
   ·查询子系统的实现第69-76页
     ·Spring 框架和Ajax 概述第69-70页
     ·主要功能第70页
     ·查询子模块的具体实现第70-76页
6 总结与展望第76-78页
致谢第78-79页
参考文献第79-81页
附录第81-83页

论文共83页,点击 下载论文
上一篇:硅溶胶强化杨木复合材的制备与性能研究
下一篇:静脉注射53Cr标记吡啶甲酸铬对仔猪细胞DNA及氧化的影响